物流实时数仓——概述与准备工作

目录

一、架构设计与技术栈

(一)数仓架构设计

 (二)所用技术栈

(三)最终效果

二、关于离线与实时的相关概念

三、实时数仓设计思路


一、架构设计与技术栈

(一)数仓架构设计

 (二)所用技术栈

Hadoop 3.3.4

Zookeeper 3.7.1

Kafka 3.3.1

Hbase 2.4.11

Redis 6.0.8

Flink 1.17.0

Clickhouse

Spring

Sugar

(三)最终效果

二、关于离线与实时的相关概念

物流

        业务

离线

        批处理

        在处理数据前,数据是固定的

        处理数据量大

        处理时间长

        T + 1

实时

        流处理

        在处理数据前,数据是不确定的,在处理的过程中,数据源源不断地进来

        处理数据量小

        处理时间短

        T + 0

数仓

        采集、存储、分析

三、实时数仓设计思路

        业务数据保存在mysql中,通过flink-CDC采集到kafka主题中作为ODS层;在通过flink-CDC判断ODS层的数据哪些是维度表,哪些是事实表,维度数据DIM层写到Hbase中,事实数据DWD层写到新的kafka主题中;再将DIM层数据和DWD层数据进行关联,做一个轻度聚合形成DWS层,写到OLAP数据库中,即clickhouse中,形成宽表;指标统计与统计结果通过Springboot数据接口服务写到sugar进行可视化展示,也就是ADS层。

物流实时数仓架构设计图

物流离线数仓架构设计图

 

相关推荐

  1. 物流实时DWD层——1.准备工作

    2024-01-24 02:16:01       40 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-01-24 02:16:01       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-01-24 02:16:01       100 阅读
  3. 在Django里面运行非项目文件

    2024-01-24 02:16:01       82 阅读
  4. Python语言-面向对象

    2024-01-24 02:16:01       91 阅读

热门阅读

  1. Excel——冻结前三列

    2024-01-24 02:16:01       59 阅读
  2. 面试 Vue 框架八股文十问十答第六期

    2024-01-24 02:16:01       64 阅读
  3. unity3d在汽车邻域应用浅谈

    2024-01-24 02:16:01       54 阅读
  4. 每日coding

    2024-01-24 02:16:01       59 阅读
  5. HTML。

    2024-01-24 02:16:01       48 阅读
  6. Go 入门

    2024-01-24 02:16:01       43 阅读
  7. gdb调试代码的入门知识

    2024-01-24 02:16:01       62 阅读
  8. TestNG注释- @AfterTest注释

    2024-01-24 02:16:01       54 阅读