【华为数据之道学习笔记】6-7打造业务自助分析的关键能力

      华为公司将自助分析作为一种公共能力,在企业层面进行了统一构建。一方面,面向不同的消费用户提供了差异性的能力和工具支撑;另一方面,引入了“租户”概念,不同类型的用户可以在一定范围内分析数据、共享数据结果。

        1. 针对三类角色提供的差异性服务

        面向三类角色的分析架构能力。

    (1)面向业务分析师,提供自助分析能力,业务人员通过“拖、拉、拽”即可快速产生分析报告

  • 基于多租户环境,提供数据资产订阅、报表作品搜索、服务订阅等能力。
  • 实现从数据查询到数据拖拽式分析的端到端的一站式自助作业,增强数据即席查询和数据建模等功能。
  • 提供数据搜索、数据获取、自助分析、数据消费等一站式自助分析服务,缩短报表开发周期。
  • 支持租户管理、工具集管理、日志管理功能,集成数据底座权限模型,提供稳定的分析环境。

   (2)面向数据科学家,提供高效的数据接入能力和常用的数据分析组件,快速搭建数据探索和分析环境

  • 集成数据可视化、数据建模能力,降低数据分析门槛,提高平台的易用性。
  • 识别公共诉求,提供R Studio、Zeppelin等工具集,增强NLP基础服务、人工智能等分析装备对于机会点的支撑能力,支撑各种大数据分析应用场景。
  • 提供源系统到分析平台的数据实时同步功能。
  • 为数据科学家提供数据目录导航入口。
  • 提供数据分析环境,支持权限申请和计算资源的分配,缩短建模周期。

  (3)面向IT开发人员,提供云端数据开发、计算、分析、应用套件,支撑海量数据的分析与可视化,实现组件重用

  • 整合数据接入、数据计算、数据挖掘、数据展现等能力,提供高效、安全的数据集成、数据开发、报告开发、数据管理等服务,减少重复建设,实现组件重用。
  • 整合第三方资源,依托HIC能力通道,提供自助、按需、在线的基础数据服务,包括分布式处理、实时处理、内存计算等。

        2. 以租户为核心的自助分析关键能力

      (1)多租户管理能力

        租户是指把数据、分析工具、计算资源有机组合的工作环境,用户可以在租户内自助完成数据搜索、数据加工、在线分析、报表共享等工作。

        多租户技术也称多重租赁技术,是一种软件架构技术。多租户技术可以实现多个租户之间共享系统实例,同时也可以实现租户的系统保证系统共性的部分被共享,个性的部分被单独隔离。例如,按国家设定不同租户,这样在本租户内共享该国的经营分析结果,共同进行异常分析和经营改进;同时,该租户数据对其他国家屏蔽,避免了数据扩散等安全风险。

        为了合理分配软硬件资源,满足各领域在线、自助、个性化的数据分析诉求,促进数据的安全共享和价值变现,明确了租户申请、租户命名、数据准备、数据同步、数据加工、数据申请、权限管理、安全与隐私、运维与运营等方面的要求,旨在通过正确的引导,确保数据消费的便捷、高效与安全合规,支持公司的数字化转型。

        在多租户建设中,相对于技术层面的解决方案,租户管理的职责需要在企业里建立共识,将共识以标准规范的形式固化下来。。

        租户的4个关键角色如下所示。

  • 租户Owner:租户管理的第一责任人,由公司正式任命的管理者或者变革项目经理担任,是租户内数据消费的总责任人。
  • 租户管理员:由租户Owner指定并授权,是对租户内资产、用户、报告的日常维护、配置、授权承担具体管理职责的人员。
  • 查看者:申请并被允许加入租户,只对租户内的报告有查看权限的租户用户。
  • 分析师:申请并被允许加入租户,对数据资产可执行申请数据入租户、申请租户授权通过分析工具分析数据、制作报告、查看报告、分享报告等操作的租户用户。

  (2)数据加工能力

    在同一个租户空间内,对数据进行关联、过滤等操作,满足最终分析报告的数据需求。

    用户可将多个数据进行关联,构建自己的宽表,可对宽表进行数据过滤,选择合适的字段以及增加计算字段。     

 (3)数据分析能力

        基于消费场景,利用租户内授权的数据资产,通过分析工具对数据进行分析并生成可视化报告。

        用户可以选择即席查询自行配置各类条件后的结果数据,再基于这些数据直接链接到不同的分析工具,进行进一步的数据分析。

        1)即席查询

        提供通过筛选条件展示结果数据的能力。

        提供生产环境的实时数据内容,有助于用户通过筛选后的结果数据判断能否满足最终的分析需求。

        分析结果支持以文件服务器的方式下载,满足本地化处理的需求,同时避免数据被过度共享。

        2)可视分析

        查看已授权并加工好的数据的详情,进入可视化分析阶段,充分利用企业现有的分析工具,或打通主流的商业分析工具,减少开发成本,降低学习成本。

        数据打通,已授权加工后的数据可以直接进入分析工具进行分析操作。最大程度利用各种分析工具的已有功能。

    (4)自助分享能力

        基于自助分享能力,可以对分析报告进行密级设定和权限管理,向租户个人或者群体分享报告,不仅可以分享给本租户内指定的用户,而且可以进行跨租户分享。这样一方面可以扩大报告的使用范围,降低报告重复建设过程中的成本,另一方面也有助于解决分析结果不一致的问题。

  • 对报表提供浏览和编辑能力,查找需要浏览的报表,选择查看、编辑、分享、删除功能。
  • 提供对生成的报告定义密级的能力,报告生成者作为报告的Owner,定义密级和管控分享范围。

最近更新

  1. TCP协议是安全的吗?

    2023-12-26 10:06:01       17 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2023-12-26 10:06:01       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2023-12-26 10:06:01       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2023-12-26 10:06:01       18 阅读

热门阅读

  1. http请求超时 ,用PHP如何解决的?

    2023-12-26 10:06:01       35 阅读
  2. MySQL联合索引

    2023-12-26 10:06:01       33 阅读
  3. Docker资源

    2023-12-26 10:06:01       29 阅读
  4. 制作spring boot docker镜像Dockerfile文件编写

    2023-12-26 10:06:01       34 阅读
  5. StarRocks-3.1.6升级

    2023-12-26 10:06:01       25 阅读
  6. PAT.1101.QuickSort

    2023-12-26 10:06:01       29 阅读
  7. 每日一水:leetcode1576.替换所有的问号

    2023-12-26 10:06:01       38 阅读
  8. Nestjs使用log4j打印日志

    2023-12-26 10:06:01       38 阅读