gpt4 book ai didi

apache-flink - Apache Flink : My application does not resume from a checkpoint when I restart it

转载 作者:行者123 更新时间:2023-12-04 12:11:45 28 4
gpt4 key购买 nike

我有一个 Flink 作业,我正在从文件夹中读取文件并将其转储到数据库中。每天都会有新文件进入该文件夹。
我启用了检查点,以便如果由于任何原因 Flink 作业停止并且我需要重新启动,Flink 作业不应读取已读取的文件。
我在代码中添加了以下几行,但是当我重新启动我的工作时,Flink 工作再次读取所有文件。

env.setStateBackend(new FsStateBackend("file:///C://Users//folder"));
env.enableCheckpointing(10L);

最佳答案

检查点是一种在应用程序执行期间从故障中恢复的机制,而不是恢复被明确取消的应用程序。

如果您有一个正在运行的应用程序并且执行失败(无论出于何种原因),Flink 将尝试通过重新启动应用程序并从最后一个检查点初始化操作符的状态来恢复该应用程序。如果恢复失败(例如因为没有足够的处理槽可用),则作业被视为失败。

如果您手动取消应用程序并重新启动它,Flink 将不会作为检查点来初始化运营商的状态。事实上,当你取消一个应用程序时,Flink 会(默认)删除所有检查点。

您正在寻找的概念是保存点。保存点与检查点非常相似,但由用户手动触发,当应用程序被明确取消时不会自动删除。启动应用程序时,您可以从保存点启动它,这意味着运算符(operator)状态是从保存点初始化的。

还有不同的重启策略可用于配置 Flink 尝试重启失败应用程序的频率和间隔。

关于apache-flink - Apache Flink : My application does not resume from a checkpoint when I restart it,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54324827/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com