gpt4 book ai didi

apache-kafka - Flink+Kafka重置检查点和偏移量

转载 作者:行者123 更新时间:2023-12-04 04:10:16 24 4
gpt4 key购买 nike

简而言之,我想从头在Kafka 中的数据上重新运行一个Flink 管道。

Flink 0.10.2,Kafka 0.8.2。

我在 Kafka 中有一个保留 2 小时的推文主题,在 Flink 中有一个管道,每 10 秒以 5 分钟的滑动窗口计算推文。

如果我中断管道并重新运行它,我希望它重新读取较旧的推文,从而发出 5 分钟的推文计数。相反,它似乎从新到达的推文重新开始,因此需要 5 分钟才能计数“正常”。

我已经尝试了 auto.offset.reset = smallest/earliest 和更改 group.id,但没有成功。我还尝试按照此处所述手动更改 Kafka 中的偏移量:https://metabroadcast.com/blog/resetting-kafka-offsets

然后我假设这个问题可能与 Flink 的检查点有关,但我不知道/找不到有关如何重置它的信息。

任何人都可以分享一些工作代码吗?谢谢,E。

最佳答案

要重新阅读 Kafka 主题中可用的所有内容,将新的“group.id”和“auto.offset.reset”设置为“earliest”就足够了。

如果这不起作用,则有问题。

关于apache-kafka - Flink+Kafka重置检查点和偏移量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35517357/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com