【华为数据之道学习笔记】4-1信息架构的四个组件

        企业在运作过程中,首先需要管理好人和物等“资源”,然后管理好各类资源之间的联系,即各类业务交易“事件”,再对各类事件的执行效果进行“整体描述和评估”,最终实现组织目标和价值。以一个通用的工业企业运营为例(如图4-1所示),企业要管理关键的“员工、组织、产品、客户、供应商”等资源。在企业价值实现的过程中,企业会与客户签订销售合同,与供应商签订采购合同,组建各种交付项目,制定供应计划,财务部门会对成本、费用、收入进行核算,记录客户的应收、供应商的应付,建立合法合规的会计记账体系。然后,通过报告体系按月度、季度、年度发布各种经营、考核报告用于企业决策。
图 信息架构示例
        信息架构的目的就是定义好整个运作过程中涉及的各种人、事、 物资源,并实施有效的治理,从而确保各类数据在企业各业务单元间高效、准确地传递,上下游流程快速地执行和运作。
        华为在实践中构建了一套对业务运作数据进行有效管理的信息架构方法论,用于指导企业内部各部门的信息架构建设工作,让管理者、专家和员工之间有共同语言。
        华为的企业级信息架构(Information Architecture)是指以结构化的方式描述在业务运作和管理决策中所需要的各类信息及其关系的一套整体组件规范,包括数据资产目录、数据标准、企业级数据模型和数据分布四个组件,如图所示。

4.1.1 数据资产目录

        数据资产目录形成完善的企业资产地图,也在一定程度上为企业数据治理、业务变革提供了指引。基于数据资产目录可以识别数据管理责任,解决数据问题争议,帮助企业更好地对业务变革进行规划设计,避免重复建设。
        数据资产目录分为5层,涵盖华为公司的所有业务数据资产,如图所示。
        
        L1为主题域分组,是描述公司数据管理的最高层级分类。业界通 常有两种数据资产分类方式:基于数据自身特征边界进行分类和基于业务管理边界进行分类。华为公司为了强化企业内业务部门的数据管理责任,更好地推进数据资产建设、数据治理和数据消费建设,采用业务管理边界划分方式,即将L1主题域分组与流程架构L1相匹配,数据资产和华为业务GPO(全球流程责任人)相匹配,有利于更好地推进各项数据工作。
        L2为主题域,是互不重叠的数据分类,管辖一组密切相关的业务对象,通常同一个主题域有相同的数据Owner。
        L3为业务对象,是信息架构的核心层,用于定义业务领域重要的人、事、物,架构建设和治理主要围绕业务对象开展。同时,在企业架构(EA)的范畴内,信息架构(IA)也主要通过业务对象实现与业务架构(BA)、应用架构(AA)、技术架构(TA)的架构集成。
        L4是逻辑数据实体,是指描述一个业务对象在某方面特征的一组属性集合。
        L5为属性,是信息架构的最小颗粒,用于客观描述业务对象在某方面的性质和特征。

4.1.2 数据标准

        数据标准是在企业范围内确保数据一致的关键,因此有必要多花一些篇幅来详细介绍。
        数据标准定义公司层面需共同遵守的属性层数据含义和业务规 则,是公司层面对某个数据的共同理解,这些理解一旦确定下来,就 应作为企业层面的标准在企业内被共同遵守。
        例如,合同是公司最重要的数据之一,因此有必要对合同编号制订统一的数据标准,包括编号的位数、具体的编码规则等,一旦合同编号数据标准制订下来,那么整个公司所有业务部门都必须共同遵守,除了数据Owner以外,任何部门都不允许自定义合同编号。如果随着业务发展需要对合同编号进行变更,那么相关需求也应该统一由数据Owner受理,统一制订变更方案。一旦不同业务环节各自定义,那么数据就无法在上下游业务之间快速流转,往往需要额外的人工转换和翻译,这会极大地增加不必要的人工成本、延长业务执行周期、降低业务效率。
        华为公司对业务数据标准有严格的限定,每个数据标准应该覆盖以下三方面。
  • 业务视角要求: 用于统一业务侧语言和理解,明确定义每个属性所遵从的业务定义和用途、业务规则、同义词,并对名称进行统一定义,避免重复。
  • 技术视角要求: 对IT实施形成必要的指引和约束,包括数据类型、长度,如果存在多个允许值,则应对每个允许值进行明确的限定。
  • 管理视角要求: 明确各业务部门在贯彻数据标准管理方面应承担的责任,包括业务规则责任主体、数据维护责任主体、数据监控责任主体,因为很多情况下这些责任并不是由同一个业务部门来负责,所以必须在标准制订时就约定清楚。例如,“客户合同”中某些条款的规则制订者可能是财经部门,负责与客户达成约定并在系统中录入的可能是销售业务部门,而对整个客户合同数据质量进行跟踪、监控的可能是数据专业部门。
        但是,企业的每个业务数据标准的定义和维护都需要一定的成本,很多大型企业的IT系统中可能存在上百万、上千万属性,即使去掉冗余、重复的部分,数据量也相当大,因此其实并不需要对IT系统内所有字段都进行定义。为了实现在统一定义的必要性和成本之间取得平衡,华为公司制订了数据标准规范,明确了在不同情况下哪些数据应该制订统一的标准。
        描述业务对象的特有属性应作为本业务对象的属性进行定义,并明确业务数据标准。引用其他业务对象的属性,如果属性值可随本业务对象确定和更改,就应作为本业务对象的属性进行定义,并明确业务数据标准。
引用其他业务对象的属性,如果属性值取自引用业务对象相应时点的数值且后续不变更,就应纳入本业务对象的数据标准范围,并明确相应取值规则。
        引用其他业务对象的属性,如果属性值与引用业务对象同步,就不需要重新定义数据标准。
        引用其他业务对象/逻辑数据实体的身份标识属性,应作为本业务对象的属性进行定义,但只能在业务数据标准中定义出处及引用规则,而不允许修改或重新定义该属性本身的业务含义及业务规则。

4.1.3 数据模型

        数据模型是从数据视角对现实世界特征的模拟和抽象,根据业务 需求抽取信息的主要特征,反映业务信息(对象)之间的关联关系。
        数据模型不仅能比较真实地模拟业务(场景),同时也是对重要业务模式和规则的固化。例如在某个物流业务数据模型中,“运输申付单”与“运输委托”建立一对一关系,而“运输委托”与“派送任务”建立多对多关系,那么这意味着业务部门可以根据发货效率和成本的考虑将“运输委托”拆成分多个“派送任务”,但“派送任务”必须在将一个运输委托完整执行后,才能申请向供应商付款。

4.1.4 数据分布

        如果说前三个组件主要是从静态角度对数据、数据关系进行定义,那么数据分布则定义了数据产生的源头及在各流程和IT系统间的流动情况。 数据分布组件的核心是数据源,指业务上首次正式发布某 项数据的应用系统,并经过数据管理专业组织认证,作为企业范围内 唯一数据源头被周边系统调用。华为公司规定所有业务数据必须认证数据源,并在公司范围内统一发布。为了更好地识别、管理数据在流程和IT系统间的流动,可以通过信息链、数据流来进行描述,体现某一 数 据 在 流 程 或 应 用 系 统 中 是 如 何 被 创 建 ( Create ) 、 读 取(Read)、更新(Update)、删除(Delete)的。

最近更新

  1. TCP协议是安全的吗?

    2023-12-16 04:56:03       14 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2023-12-16 04:56:03       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2023-12-16 04:56:03       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2023-12-16 04:56:03       18 阅读

热门阅读

  1. linux电源管理

    2023-12-16 04:56:03       35 阅读
  2. 微信小程序实现图片下载与保存功能

    2023-12-16 04:56:03       84 阅读
  3. Kotlin中对生成二维码的使用详解

    2023-12-16 04:56:03       35 阅读
  4. jmeter 的beanshell使用

    2023-12-16 04:56:03       25 阅读
  5. GAN 介绍

    2023-12-16 04:56:03       40 阅读
  6. redis服务器版本升级问题

    2023-12-16 04:56:03       34 阅读
  7. 明明随机数

    2023-12-16 04:56:03       43 阅读
  8. react内置组件之<StrictMode></StrictMode>

    2023-12-16 04:56:03       30 阅读
  9. 通过Ai帮我们写前端界面设计

    2023-12-16 04:56:03       39 阅读