gpt4 book ai didi

apache-kafka - 如何始终使用 kafka-streams 中的最新偏移量

转载 作者:行者123 更新时间:2023-12-01 11:17:53 25 4
gpt4 key购买 nike

我们的要求是,如果 kafka-stream 应用程序正在消耗一个分区,它应该从该分区的最新偏移量开始消耗。

这似乎可以使用

streamsConfiguration.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, "latest")

现在,假设使用上述配置,kafka-stream 应用程序开始从分区的最新偏移量开始使用数据。一段时间后,应用程序崩溃。当应用程序重新上线时,我们希望它使用该分区最新偏移量的数据,而不是它上次读取时离开的位置。

但是我找不到任何可以帮助使用 kafka-streams api 实现它的东西。

附言我们正在使用 kafka-1.0.0。

最佳答案

这不支持开箱即用。

配置auto.offset.reset仅触发,如果没有提交的偏移量并且没有配置来更改此行为。

您可以在启动前手动操作偏移量
使用 bin/kafka-consumer-groups.sh虽然——application.id是个group.id并且您可以在重新启动应用程序之前“寻求结束”。

更新:

从 1.1.0 版本开始,您可以使用 bin/kafka-streams-application-reset.sh工具来设置起始偏移。要使用该工具,应用程序必须处于离线状态。 (参见:https://cwiki.apache.org/confluence/display/KAFKA/KIP-171+-+Extend+Consumer+Group+Reset+Offset+for+Stream+Application)

关于apache-kafka - 如何始终使用 kafka-streams 中的最新偏移量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48344981/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com