gpt4 book ai didi

apache-kafka - 卡夫卡流 : output to a topic first or persist directly?

转载 作者:行者123 更新时间:2023-12-04 18:02:02 24 4
gpt4 key购买 nike

相当多的文章描述了如何使用 Kafka Streams 将它们输出到新的 Kafka 主题,而不是保存到某种分布式数据库。

这只是一个常见的用例,假设嵌入式 db + 交互式查询就足够了,还是有一些架构上的原因,为什么人们想要在再次使用它之前输出一个主题来持久化它,而不是直接持久化?

我不确定它是否有所作为,但我正在查看的示例的上下文是用于翻转时间窗口聚合。

最佳答案

如果您只想从 kafka 中取出数据并将其存储在 db 中,那么 Kafka Connect 是最自然的方式。

另一方面,如果您的主要用例是进行聚合,那么 Kafka Streams 确实是一种简单而优雅的方法。如果您的首选数据库已经存在 Kafka Connect 接收器,那么最直接的方法是让 Kafka Streams 将输出写入主题,然后让该 Kafka Connect 接收器将其提取并存储在您的数据库中。如果不存在开箱即用的接收器并且您必须编写它并且您认为它的可重用性不够,那么您可能会选择将其编写为自定义的 Kafka Streams 处理器,而没有输出 Kafka 主题.

如您所见,根据您的用例和偏好,有多种方法可以使用。没有一种正确的方法,所以请考虑所涉及的权衡。

关于apache-kafka - 卡夫卡流 : output to a topic first or persist directly?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44618514/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com