宽表的优缺点,你明白吗?

        宽表属于事实表的一种,宽表就是字段较多的表,字段多就意味着包含更多的数据信息,信息多意味着能够提供更完整的业务价值,宽表的实现在效率上会比普通表来的更快。因为普通表在数据仓库建设时需要考虑到维度拆分,满足数据库的范式原则等。

        对于同一个业务需求来说,宽表直接就可以提供满足需求的所有维度,而普通表一般情况下则需要通过各种维度的join操作之后才能达到这个目的,而join操作一定会触发shuffle的,而shuffle会成为效率的绊脚石,让整个数据分析流程变得缓慢。

        宽表的缺点,因为把所有跟某个事件相关的维度都揉在了一起,这样就会导致其中一些变化缓慢的维度信息出现大量的数据重复,从而占据过多的存储空间;此外因为一张宽表很多时候只是面向某一个业务需求就把相关的指标都揉在一张表里,而如果需求稍微一变化可能就得重新设计一张新的宽表,这样就会导致单张表的灵活性很低,使用场景很窄;如果类似的需求很多的话,那么系统就会出现大量这种复用度很低的宽表,给人感觉整个数仓的建设缺少设计感,系统的开发效率也会变低,因为没有中间层的概念,所以就没有模块复用这种情况;因为大家都只想着数据为最终的业务目标服务,不会思考过程的建设和规范,陷入一种比较极端的开发状态中;数据仓库建模的存在就是为了将数据根据其功能和属性特点进行拆分,目的是为了用更小的开发成本来满足多变的业务需求;如果系统全部都用宽表的话,那么这个建模工作所带来的收益就会被大大的削弱,让系统的数据存储变得十分的臃肿。

        宽表在带来数据处理效率提升的同时,也破坏了数据库建模的很多规范,合理使用宽表。

相关推荐

  1. 优缺点,明白

    2024-04-02 23:06:01       16 阅读
  2. 了解Redis 二进制安全

    2024-04-02 23:06:01       37 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-04-02 23:06:01       19 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-04-02 23:06:01       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-04-02 23:06:01       20 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-04-02 23:06:01       20 阅读

热门阅读

  1. Google人才选拔的独特视角

    2024-04-02 23:06:01       16 阅读
  2. 一文读懂485通讯协议

    2024-04-02 23:06:01       13 阅读
  3. 系统学习Docker:1_Docker简介以及2_安装Docker

    2024-04-02 23:06:01       20 阅读
  4. vi/vim编辑器

    2024-04-02 23:06:01       17 阅读
  5. 开源中文大语言模型汇总

    2024-04-02 23:06:01       16 阅读
  6. pip/conda导出或导入环境

    2024-04-02 23:06:01       14 阅读
  7. 迪米特法则

    2024-04-02 23:06:01       16 阅读