Flink CDC 同步数据到Doris

Flink CDC 同步数据到Doris

Flink CDC 是基于数据库日志 CDC(Change Data Capture)技术的实时数据集成框架,支持了全增量一体化、无锁读取、并行读取、表结构变更自动同步、分布式架构等高级特性。配合 Flink 优秀的管道能力和丰富的上下游生态,Flink CDC 可以高效实现海量数据的实时集成。

image-20240328170106837

Flink CDC 与数据同步面临的挑战

虽然 Flink CDC 有很多技术优势,社区用户增长很快,但随着 Flink CDC 项目用户基数的日益增长,以及应用场景的不断扩大,社区收到了很多用户反馈:

  • 用户体验:只提供 Flink source,不支持端到端数据集成, SQL 和 DS API 构建作业流程复杂
  • 维护频繁:上游数据库表结构变更非常常见 ,增加、删除表的业务需求普遍存在
  • 扩展性:全量和增量阶段资源难以灵活扩缩容 ,千表同步、万表入湖入仓资源消耗大
  • 中立性:项目使用 Apache License V2 协议,不属于 Apache Flink ,版权归属于 Alibaba (Ververica)

针对这些反馈,社区的 Maintainer 也在思考在 Flink CDC 的不足,思考 CDC 乃至数据集成领域面临的技术挑战:

  • 历史数据规模大:数据库的历史数据

相关推荐

  1. flink-cdc同步mysqldoris建设数据仓储最佳实践

    2024-03-29 21:54:02       64 阅读
  2. 【flink】基于flink全量同步postgres表doris

    2024-03-29 21:54:02       58 阅读
  3. <span style='color:red;'>flinkCDC</span>

    flinkCDC

    2024-03-29 21:54:02      33 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-03-29 21:54:02       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-03-29 21:54:02       106 阅读
  3. 在Django里面运行非项目文件

    2024-03-29 21:54:02       87 阅读
  4. Python语言-面向对象

    2024-03-29 21:54:02       96 阅读

热门阅读

  1. 我的创作纪念日

    2024-03-29 21:54:02       40 阅读
  2. Leetcode 1143:最长公共子序列

    2024-03-29 21:54:02       46 阅读
  3. SQL注入攻击与防御详细讲解

    2024-03-29 21:54:02       42 阅读
  4. 服务器硬件基础知识

    2024-03-29 21:54:02       42 阅读
  5. 牛客的一道题(C)序列中删除指定数字

    2024-03-29 21:54:02       44 阅读
  6. 数据关联_3.7

    2024-03-29 21:54:02       39 阅读
  7. 基于Python的高考志愿辅助填报系统

    2024-03-29 21:54:02       41 阅读
  8. Spring

    Spring

    2024-03-29 21:54:02      45 阅读
  9. dockerfile编写

    2024-03-29 21:54:02       36 阅读