gpt4 book ai didi

apache-kafka - 使用 Apache Storm 获取数据

转载 作者:行者123 更新时间:2023-12-04 05:15:38 24 4
gpt4 key购买 nike

我已经阅读了很多文章,其中解释了 Apache Storm 的实现以从 Apache Flume 或 Apache Kafka 中摄取数据。在阅读了几篇文章后,我的主要问题仍未得到解答。使用 Apache Kafka 或 Apache Flume 的主要好处是什么?为什么不直接从源收集数据到 Apache Storm 中?

为了理解这一点,我研究了这些框架。如果我错了,请纠正我。

Apache Flume 是关于从源收集数据并将数据推送到接收器。在这种情况下接收器是 Apache Storm。

Apache Kafka 是关于从源收集数据并将它们存储在消息队列中,直到 Apache Storm 处理它。

最佳答案

我假设您正在处理连续计算算法或实时分析的用例。

如果您不使用 Kafka 或任何消息队列,以下是您必须经历的过程:

(1) You will have to implement functionality like consistency of data.

(2) You are ready to implement replication on your own

(3) You are ready to tackle a variety of failures and ready to build a fault tolerant system.

(4) You will need to create a good design so that your producer and consumer are completely decoupled.

(5) You will have to implement persistence. What happens if your consumer fails?

(6) What happens to fault resilience? Do you want to take the entire system down when your consumer fails?

(7) You will have to implement delivery guarantees as well as ordering guarantees.

以上所有都是消息队列(Kafka 等)的固有特性,您当然不想在这里重新发明轮子。

关于apache-kafka - 使用 Apache Storm 获取数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28832323/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com