数据仓库实践:了解和定义指标

指标分类

指标分类主要分为原子指标、派生指标、衍生指标

原子指标

某一业务事件下的度量,是不可再拆分的值,这些值一般有明确业务含义的名称,如库存数量、人员数量;

度量:在维度建模中,将度量称为事实,将环境描述为维度,维度是用于分析事实所需要的多样环境。度量通常为数值型数据,作为事实逻辑表的事实。

派生指标

是1个原子指标+多个修饰词(可选)+时间周期,是原子指标业务统计范围的圈定。

派生指标又分以下二种类型:

事务型指标:是指对业务过程事务结果进行衡量的指标。例如订单金额,这类指标需要维护原子指标以及修饰词,在此基础上创建派生指标。

存量型指标:是指对实体对象(如司机、员工)某些状态的统计,例如注册司机总数、注册乘客总数,这类指标需要维护原子指标以及修饰词,在此基础上创建派生指标,对应的时间周期一般为“历史截止当前某个时间”。

衍生指标

是在事务性指标和存量型指标的基础上复合成的,主要有比率型、比例型、统计型均值,例如离职率等等。

规范化定义指标

指标命名公式

指标 = 限定词+业务主题+指标名称+量化词根(统计粒度)

限定词

限定词就是用来对指标进行限定约束。比如:当天、本周、当月、平均、累计

业务主题

业务主题是用来描述业务在哪个过程阶段。比如:打开页面、下单、点击支付、支付成功、支付失败。

指标名称

指标名称就是指标要统计的对象实体名称。比如:订单、用户、材料、设备。

量化词根

量化词根通常以数字单位出现,明确表达这个指标的统计粒度。比如:数量、金额、次数、比率、占比。

示例

四个组成要素

限定词:本月
业务主题:下单并支付成功
指标名称:销售金额
量化词根:金额

组合

本月(限定词)+支付成功(业务主题)+销售额(指标名称)+金额(量化词)

命名简化:本月+支付成功的+销售额+金额

指标命名结果:本月支付成功的销售金额

相关推荐

  1. 数据仓库实践了解定义指标

    2024-07-18 20:04:04       23 阅读
  2. 数仓实践数据仓库建设公共规范指南

    2024-07-18 20:04:04       19 阅读
  3. 如何建设维护数据仓库:深入指南

    2024-07-18 20:04:04       25 阅读
  4. 如何实现定义度量指标Actuator端点?

    2024-07-18 20:04:04       32 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-18 20:04:04       70 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-18 20:04:04       74 阅读
  3. 在Django里面运行非项目文件

    2024-07-18 20:04:04       62 阅读
  4. Python语言-面向对象

    2024-07-18 20:04:04       72 阅读

热门阅读

  1. 互联网摸鱼日报(2024-07-18)

    2024-07-18 20:04:04       23 阅读
  2. 【Unity】RPG2D龙城纷争(十三)升级系统

    2024-07-18 20:04:04       27 阅读
  3. 使用 GO 和 Python 分别写爬虫的区别

    2024-07-18 20:04:04       21 阅读
  4. 数据库系统概论:数据库查询语言 SQL

    2024-07-18 20:04:04       22 阅读
  5. 017.自定义指纹浏览器-传参固定指纹(二)

    2024-07-18 20:04:04       18 阅读
  6. 【时时三省】单元测试 简介

    2024-07-18 20:04:04       23 阅读
  7. 正则表达式

    2024-07-18 20:04:04       22 阅读