gpt4 book ai didi

message-queue - Kafka中如何同时实现分布式处理和高可用?

转载 作者:行者123 更新时间:2023-12-02 17:40:01 25 4
gpt4 key购买 nike

我有一个由 n 个分区组成的主题。为了进行分布式处理,我创建了两个在不同机器上运行的进程。他们使用相同的 groupd id 订阅主题并分配 n/2 个线程,每个线程处理单个流(每个进程 n/2 个分区)。

这样我就可以实现负载分配,但现在如果进程 1 崩溃,进程 2 就无法使用分配给进程 1 的分区中的消息,因为它在开始时只监听 n/2 个流。

否则,如果我配置 HA 并在两个进程上启动 n 个线程/流,那么当一个节点发生故障时,所有分区将由其他节点处理。但在这里,我们对分布进行了妥协,因为所有分区一次将由一个节点处理。

有没有办法同时实现两者以及如何实现?

最佳答案

是的,使用现有的流处理引擎。 Storm是一个不错的选择,Spark 也是如此。和 Samza ,取决于您的用例。

现在您可以自行部署,但正如您已经发现的那样,管理失败的流程和高可用性是很棘手的。一般来说,分布式处理充满了许多其他人已经解决了的微妙问题。站在你的立场上,我会使用现有的软件来解决这个问题。

关于message-queue - Kafka中如何同时实现分布式处理和高可用?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30060261/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com