gpt4 book ai didi

apache-flink - 什么可能导致 Apache Flink 作业中的屏障对齐持续时间过长?

转载 作者:行者123 更新时间:2023-12-04 01:30:15 25 4
gpt4 key购买 nike

我在 YARN 上运行我的 Flink 作业,我发现少数子任务遇到了较长的对齐持续时间。

什么可能导致这个问题?

最佳答案

对于 exactly-once 语义,Flink 在接收多个输入流的运算符处对齐流,因此大对齐意味着任务管理器比其他节点晚接收一些障碍。

可以找到关于对齐的文档here ,还有办法monitor checkpointing

更具体地说,原因可能是:

  1. 数据偏差。大部分数据已发送到大对齐持续时间节点。
  2. 垃圾收集:GC 会极大地影响检查点对齐。
  3. 长状态访问,即需要很长时间来放置或从状态中获取。对于RocksDB,检查是否存在index miss或者cache miss问题。
  4. Network buffers problem .
  5. 用户代码错误。例如,死循环或其他问题。

关于apache-flink - 什么可能导致 Apache Flink 作业中的屏障对齐持续时间过长?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51832577/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com