【华为数据之道学习笔记】5-2华为数据湖的特点

        华为数据湖是逻辑上对内外部的结构化、非结构化的原始数据的逻辑汇聚。数据入湖要遵从6项入湖标准,基于6项标准保证入湖的质量,同时面向不同的消费场景提供两种入湖方式,满足数据消费的要求。经过近两年的数据湖建设,目前已经完成1.2万个逻辑数据实体、28万个业务属性的入湖,同时数据入湖在华为公司也形成了标准的流程规范,每个数据资产都要入湖成为数据工作的重要标准。
数据湖总体视图
        华为数据湖主要有以下几个特点。
        1)逻辑统一
        华为数据湖不是一个单一的物理存储,而是根据数据类型、业务区域等由多个不同的物理存储构成,并通过统一的元数据语义层进行定义、拉通和管理。
        2)类型多样
        数据湖存放所有不同类型的数据,包括企业内部IT系统产生的结构化数据、业务交易和内部管理的非结构化的文本数据、公司内部园区各种传感器检测到的设备运行数据,以及外部的媒体数据等。
        3)原始记录
        华为数据湖是对原始数据的汇聚,不对数据做任何的转换、清洗、加工等处理,保留数据最原始特征,为数据的加工和消费提供丰富的可能。

最近更新

  1. TCP协议是安全的吗?

    2023-12-15 10:06:04       16 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2023-12-15 10:06:04       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2023-12-15 10:06:04       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2023-12-15 10:06:04       18 阅读

热门阅读

  1. 决算报表软件---政府财政管理系统

    2023-12-15 10:06:04       25 阅读
  2. 源码赏析: 数据结构转换工具 configor (一)

    2023-12-15 10:06:04       34 阅读
  3. ElasticSearch之cat shards API

    2023-12-15 10:06:04       33 阅读
  4. LeetCode 14 最长公共前缀

    2023-12-15 10:06:04       47 阅读
  5. 相机的CL、USB3.0、1394、USB2.0和GIGE接口详解和区别

    2023-12-15 10:06:04       75 阅读
  6. Springboot自带logback日志配置学习

    2023-12-15 10:06:04       49 阅读
  7. SpringBoot 上传下载文件

    2023-12-15 10:06:04       39 阅读
  8. vue和jQuery有什么区别

    2023-12-15 10:06:04       37 阅读
  9. python的四大开发包

    2023-12-15 10:06:04       26 阅读
  10. React - 实现一个支持TypeScript类型推导的 useRequest

    2023-12-15 10:06:04       44 阅读
  11. Node.js管理工具npm简单介绍

    2023-12-15 10:06:04       34 阅读
  12. el-select回显

    2023-12-15 10:06:04       41 阅读
  13. vue el-dialog封装成子组件

    2023-12-15 10:06:04       41 阅读