kafka处理大量消息积压tips —— 筑梦之路

一、consumer导致kafka积压了大量消息

场景:
1. 如果是Kafka消费能力不足,则可以考虑增加 topic 的 partition 的个数,
同时提升消费者组的消费者数量,消费数 = 分区数 (二者缺一不可)

2. 若是下游数据处理不及时,则提高每批次拉取的数量。批次拉取数量过少
(拉取数据/处理时间 < 生产速度),使处理的数据小于生产的数据,也会造成数据积压。

方法:

1. 增大partion数量,
2. 消费者加了并发,服务, 扩大消费线程
3. 增加消费组服务数量
4. kafka单机升级成了集群
5. 避免消费者消费消息时间过长,导致超时
6. 使Kafka分区之间的数据均匀分布

二、消息过期失效

产生消息堆积,消费不及时,kafka数据有过期时间,一些数据就丢失了,主要是消费不及时

经验

1. 消费kafka消息时,应该尽量减少每次消费时间,可通过减少调用三方接口、读库等操作,
从而减少消息堆积的可能性。
2. 如果消息来不及消费,可以先存在数据库中,然后逐条消费
(还可以保存消费记录,方便定位问题)
3. 每次接受kafka消息时,先打印出日志,包括消息产生的时间戳。
4. kafka消息保留时间(修改kafka配置文件, 默认一周)
5. 任务启动从上次提交offset处开始消费处理

三、综上使用kafka注意事项

1. 由于Kafka消息key设置,在Kafka producer处,给key加随机后缀,使其均衡
2. 数据量很大,合理的增加Kafka分区数是关键。
Kafka分区数是Kafka并行度调优的最小单元,如果Kafka分区数设置的太少,
会影响Kafka consumer消费的吞吐量. 如果利用的是Spark流和Kafka direct approach方式,
也可以对KafkaRDD进行repartition重分区,增加并行度处理.

相关推荐

  1. kafka处理大量消息积压tips ——

    2024-01-03 16:04:01       61 阅读
  2. 命令行重置kafka消费最新数据 ——

    2024-01-03 16:04:01       65 阅读
  3. kafka消息积压处理方案

    2024-01-03 16:04:01       28 阅读
  4. arm64架构下源码编译安装kafka ——

    2024-01-03 16:04:01       26 阅读
  5. 深入理解Dockerfile ——

    2024-01-03 16:04:01       53 阅读
  6. ffmpeg静态编译 ——

    2024-01-03 16:04:01       70 阅读
  7. LVM逻辑卷管理快照 ——

    2024-01-03 16:04:01       28 阅读
  8. ansible crontab任务管理 ——

    2024-01-03 16:04:01       36 阅读
  9. linux 常用脚本搜集(nginx) ——

    2024-01-03 16:04:01       59 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-01-03 16:04:01       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-01-03 16:04:01       101 阅读
  3. 在Django里面运行非项目文件

    2024-01-03 16:04:01       82 阅读
  4. Python语言-面向对象

    2024-01-03 16:04:01       91 阅读

热门阅读

  1. vue常见面试题

    2024-01-03 16:04:01       44 阅读
  2. 基于SpringBoot的智慧生活商城系统

    2024-01-03 16:04:01       58 阅读
  3. CSS-5

    2024-01-03 16:04:01       55 阅读
  4. Linux内核--进程管理(七)进程的核心—task_truct

    2024-01-03 16:04:01       45 阅读
  5. IEC 61850 dsAin 和 dsDin的区别

    2024-01-03 16:04:01       54 阅读
  6. 华为鸿蒙应用--文件管理工具(鸿蒙工具)-ArkTs

    2024-01-03 16:04:01       136 阅读
  7. 第三方支付“收单”是什么?

    2024-01-03 16:04:01       137 阅读
  8. MySQL数据库连接超时和自动重连

    2024-01-03 16:04:01       56 阅读
  9. 国企两年,我懂得了这些职场真理!

    2024-01-03 16:04:01       65 阅读
  10. 【MySQL】主键和外键

    2024-01-03 16:04:01       68 阅读