gpt4 book ai didi

apache-kafka-streams - KTable 状态存储持久化

转载 作者:行者123 更新时间:2023-12-01 11:15:52 26 4
gpt4 key购买 nike

如果我在实现 KTable 时使用持久存储,状态存储是否会在应用程序重新启动时保持持久?例如,如果我使用以下内容:

StreamsBuilder builder = new StreamsBuilder();
KeyValueBytesStoreSupplier storeSupplier = Stores.persistentKeyValueStore("queryable-store-name");
KTable<Long,String> table = builder.table(
"foo",
Materialized.as(storeSupplier)
.withKeySerde(Serdes.Long())
.withValueSerde(Serdes.String())

状态存储“queryable-store-name”是否可以在重新启动时使用先前运行的状态进行访问?比方说,我向主题 foo 发送了 50 条记录,并且它在状态存储中实现了。然后应用程序重新启动,我还会在状态存储中保留那 50 条记录吗?如果没有,有没有办法实现这一目标?

谢谢!

最佳答案

是的,状态存储默认保存在磁盘上。当应用程序重新启动时 application-id没有改变,状态将从磁盘中恢复,包含所有 50 条记录。当应用程序被终止/停止/重新启动时,将从偏移量添加新记录。

编辑:
似乎您缺少 KTable 之上的聚合操作,这是必需的。请参阅我的代码示例:

final KStream<CustomerKey, ViewPage> viewPagesStream=builder.stream(INPUT_TOPIC);

final KTable<Windowed<ViewPageCountKey>,Long>uniqueViewPageCount=viewPagesStream
.map((key,value)->{
ViewPageCountKey newKey=new ViewPageCountKey(key.getProjectId(),value.getUrl());
return new KeyValue<>(newKey,value);
})
.filter((key,value)->key!=null)
.groupByKey()
.count(TimeWindows.of(WINDOW_SIZE).advanceBy(WINDOW_ADVANCE),STORE_NAME);

关于apache-kafka-streams - KTable 状态存储持久化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51434619/

26 4 0