Kafka集群消息积压问题及处理方法

siwei • 2022-02-08 22:37 • 好物分享

通常情况下，企业中会采取轮询或者随机的方式，通过Kafka的producer向Kafka集群生产数据，来尽可能保证Kafka分区之间的数据是均匀分布的。
Kafka消息积压的常见场景:
1. 实时/消费任务挂掉导致的消费滞后
a. 任务重新启动后直接消费最新的消息，对于"滞后"的历史数据采用离线程序进行"补漏"。
此外，建议将任务纳入监控体系，当任务出现问题时，及时通知相关负责人处理。当然任务重启脚本也是要有的，还要求实时框架异常处理能力要强，避免数据不规范导致的不能重新拉起任务。
b. 任务启动从上次提交offset处开始消费处理
如果积压的数据量很大，需要增加任务的处理能力，比如增加资源，让任务能尽可能的快速消费处理，并赶上消费最新的消息
2. Kafka分区少了
如果数据量很大，合理的增加Kafka分区数是关键。如果利用的是Spark流和Kafka direct approach方式，也可以对KafkaRDD进行repartition重分区，增加并行度处理。
3. 由于Kafka消息key设置的不合理，导致分区数据不均衡

Kafka集群消息积压问题及处理方法最先出现在Python成神之路。

版权声明：
作者：siwei
链接：https://www.techfm.club/p/16474.html
来源：TechFM
文章版权归作者所有，未经允许请勿转载。

THE END

二维码

pytorch学习笔记四：数据的预处理模块

< <上一篇

css第四次

下一篇>>

搜索内容

Kafka集群消息积压问题及处理方法

取消回复

共有 0 条评论

Ads