Flink 快照分析：定位大状态和数据倾斜的算子

主机优惠 • 2022-02-17 01:23 • 好物分享

在 Flink 作业中，无论是 SQL 还是 JAR 模式，常常会直接或者间接地使用到状态（State）。当 Flink 进行快照时，用户定义的这些状态数据可以被保存在状态点中，以供后续的崩溃恢复。
Flink 的状态分为 Operator State 和 Keyed State，而 Keyed State 又可以分为 ValueState、MapState、ListState、AggregatingState、MergingState、ReducingState 等多种类型。此外，这些林林总总的状态又有多种具体的实现（HeapState、RocksDBState 等），状态的存取还需要各种 Serializer 和 Deserializer 的参与，整个链路精妙而又繁杂。
对于普通用户而言，Flink 内部的运行模式就像黑盒，但是状态带来的困扰却是实实在在的，尤其是在使用 SQL 的多表 JOIN 或者 GROUP BY 等语义时，很容易因为状态越来越多，导致频繁的 TaskManager OOM（内存不足），影响线上业务的稳定性，

Flink 快照分析：定位大状态和数据倾斜的算子最先出现在Python成神之路。

版权声明：
作者：主机优惠
链接：https://www.techfm.club/p/22405.html
来源：TechFM
文章版权归作者所有，未经允许请勿转载。

THE END

二维码

ncnn和opencv在vs2022上创建工程推理示例

< <上一篇

【二叉树】二叉树展开为链表

下一篇>>

搜索内容

Flink 快照分析：定位大状态和数据倾斜的算子

取消回复

共有 0 条评论

Ads