数仓实践:数据仓库建设公共规范指南

一、引言

模型是对现实事物的反映和抽象,能帮助我们更好地了解客观世界。数据模型定义了数据之间关系和结构,使得我们可以有规律地获取想要的数据。

数据模型用于有效组织企业的数据资产,其设计工作应当在一定的规范约束下进行,这是建设高质量数据模型的前提条件。因此本文档用于定义数据中台数据模型设计实施的规范要求。

二、公共规范

2.1 设计理念

企业数据的管理和组织,技术上需要满足业务对数据访问、计算、存储、质量上的技术要求,在业务上需要满足企业便捷使用数据的诉求。针对这样的诉求,业界沉淀了 OneData 体系。

数据中台数据模型设计方法是 OneData 体系的核心组成部分。它在维度建模思想基础上,针对大数据存储计算平台的特点,充分考虑新时代大数据应用特点,以数据中台体系建设的实践经验为依托,建立一套模型设计规范与准则。

在维度建模理论基础下,如何建设标准统一、质量可靠、性能优异、成本可控的数据体系是 OneData 体系追求的目标。

数据模型的维度设计主要以维度建模理论为基础,基于维度数据模型总线架构,构建一致性的维度和事实。

数据模型的事实表设计在维度模型事实表的基础上,结合数据使用场景的具体实践,进行一定扩展,采用宽表设计方法。所谓宽表:为了提升访问便利性和访问性能,在维度模型的事实表基础上,将部分常用维度退化(冗余)到事实表,或者将一些可枚举型的维度和度量,采用多指标、多字段方式实现在事实表中。

在指标定义中,采取组件化的形式,进行指标标准化定义,先规范定义,后生产࿰

相关推荐

  1. 实践数据仓库建设公共规范指南

    2024-07-15 21:18:04       19 阅读
  2. 数据建设实践数据规范

    2024-07-15 21:18:04       21 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-15 21:18:04       67 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-15 21:18:04       72 阅读
  3. 在Django里面运行非项目文件

    2024-07-15 21:18:04       58 阅读
  4. Python语言-面向对象

    2024-07-15 21:18:04       69 阅读

热门阅读

  1. 【LeetCode力扣】007. 整数反转(Python)

    2024-07-15 21:18:04       21 阅读
  2. Spark 和 Kafka 处理 API 请求与返回数据DEMO

    2024-07-15 21:18:04       18 阅读
  3. 【Kylin】Kylin入门

    2024-07-15 21:18:04       16 阅读
  4. 变态的python元组

    2024-07-15 21:18:04       20 阅读
  5. zookeeper+kafka群集

    2024-07-15 21:18:04       16 阅读
  6. 域名WHOIS查询多种方式

    2024-07-15 21:18:04       22 阅读
  7. 短链安全漏洞

    2024-07-15 21:18:04       23 阅读
  8. 08-8.3.1 冒泡排序

    2024-07-15 21:18:04       15 阅读
  9. docker 容器内部UI映射host

    2024-07-15 21:18:04       21 阅读