flink使用事件时间时警惕kafka不同分区的事件时间倾斜问题

背景

flink和kafka的消息组合消费模式几乎是实时流处理的标配,然后当在flink中使用事件时间处理时,需要注意kafka不同分区元素之间时间相差太大的问题,这样有可能会导致严重的数据堆积问题

kafka不同分区元素事件时间差异较大导致的问题

在这里插入图片描述

总结

我们在kafka的不同分区之间的事件的时间不能太过于极端,因为这样的话,下游的水印是由消费的分区中最小的那个事件时间元素来决定的,但是flink仍然会消费其它分区的元素,只是由于水印不满足,这些元素再向下游管道流动时会被临时缓冲起来,当这种情况很极端时,有可能把flink的作业搞崩溃

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2023-12-07 00:26:02       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2023-12-07 00:26:02       106 阅读
  3. 在Django里面运行非项目文件

    2023-12-07 00:26:02       87 阅读
  4. Python语言-面向对象

    2023-12-07 00:26:02       96 阅读

热门阅读

  1. Linux(gRPC):Ubuntu22.04安装gRPC

    2023-12-07 00:26:02       50 阅读
  2. 13 递归求解戳气球

    2023-12-07 00:26:02       57 阅读
  3. 使用Python绘制自定义的水平线条

    2023-12-07 00:26:02       56 阅读
  4. rust和golang的对比

    2023-12-07 00:26:02       51 阅读
  5. 力扣-435.无重叠空间

    2023-12-07 00:26:02       56 阅读
  6. go基础语法10问(1)

    2023-12-07 00:26:02       50 阅读
  7. Vue基础知识点梳理总结归纳

    2023-12-07 00:26:02       68 阅读
  8. HTML总结

    2023-12-07 00:26:02       59 阅读