gpt4 book ai didi

java - 如何连接两个 Kafka 流,每个流都有多个分区?

转载 作者:行者123 更新时间:2023-12-02 03:06:06 25 4
gpt4 key购买 nike

我有两个 Kafka 流,requestevent,每个流都在公共(public)字段 requestId(最后两位数字)上进行分区。我想加入两个流并写入 HDFS 或本地文件系统?如何编写一个高效的消费者,在连接两个时仅考虑相关的分区

最佳答案

您应该使用 Kafka 的 Streams API(Apache Kafka 的流处理库),而不是手写的消费者。要将数据写入 HDFS,您应该使用 Kafka Connect。

要进行连接,请查看以下问题:How to manage Kafka KStream to Kstream windowed join?

另请查看 Confluence 的有关 Kafka Streams 的文档和 Kafka Connect开始。如果您还有其他问题,请提出后续问题(阅读手册后:))

关于java - 如何连接两个 Kafka 流,每个流都有多个分区?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41714230/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com