ETL策略

数据仓库平台,ETL是很重要一环,看ETL的发展史,最初使用表格,人工从系统下载,在excel匹配,然后加载到数据仓库平台,到后来开始出现ETL工具,大概分为两个派别,以ETL架构的datastage,informatica,以ELT为代表的ODI,再到后来的批处理方式,SQL编码方式,但是其本质还是抽取数据,处理,再加载到目标平台,常用的方式:

1.初始化:当我们建立数仓平台时候,一开始会涉及到同步历史数据问题,那么就有两种 策略:

  • 全量同步明细数据:把历史数据,每条明细记录抽取到目标平台
  • 同步最新的YTD数据:忽略明细,只同步汇总后的数据

2.后续加载策略:

  • 全删重新插入
  • 插入新增数

3.数据处理过程

  • 映射
  • 组合
  • 拆分

相关推荐

  1. ETL策略

    2024-03-11 07:20:05       47 阅读
  2. ETLELT区别-2

    2024-03-11 07:20:05       50 阅读
  3. <span style='color:red;'>ETL</span>概念

    ETL概念

    2024-03-11 07:20:05      55 阅读
  4. 什么是ETL?

    2024-03-11 07:20:05       54 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-03-11 07:20:05       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-03-11 07:20:05       106 阅读
  3. 在Django里面运行非项目文件

    2024-03-11 07:20:05       87 阅读
  4. Python语言-面向对象

    2024-03-11 07:20:05       96 阅读

热门阅读

  1. Ubuntu安装部署Oracle-JDK11

    2024-03-11 07:20:05       51 阅读
  2. Android 获取Sms

    2024-03-11 07:20:05       38 阅读
  3. vue slot 仔细研究一下

    2024-03-11 07:20:05       45 阅读
  4. SpringBoot实现 PDF 添加水印

    2024-03-11 07:20:05       42 阅读
  5. N32L40x基于串口IAP实现(含升级工具)

    2024-03-11 07:20:05       47 阅读
  6. Go微服务: 基于Go Micro框架实现微服务调用

    2024-03-11 07:20:05       41 阅读
  7. ChatGPT 基本用法!ChatGPT4的prompt的使用例子!

    2024-03-11 07:20:05       65 阅读
  8. 四大组件的工作过程

    2024-03-11 07:20:05       35 阅读