- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我们将 Storm 与 Kafka Spout 一起使用。当消息失败时,我们希望重放它们,但在某些情况下,坏数据或代码错误会导致消息始终无法通过 Bolt,因此我们将进入无限重放循环。显然,当我们发现错误时,我们正在修复它们,但希望我们的拓扑结构具有一般的容错性。在重放 N 次以上后,我们如何 ack() 一个元组?
查看 Kafka Spout 的代码,我发现它被设计为使用指数退避计时器和 comments on the PR 重试。状态:
“spout 不会终止重试周期(我确信它不应该这样做,因为它无法报告有关中止请求的失败的上下文),它只处理延迟重试。拓扑中的一个 bolt 是仍然期望最终调用 ack() 而不是 fail() 来停止循环。”
我已经看到 StackOverflow 响应建议编写自定义 spout,但如果有推荐的方法在 Bolt 中执行此操作,我宁愿不坚持维护 Kafka Spout 内部的自定义补丁。
在 Bolt 中执行此操作的正确方法是什么?我在元组中没有看到任何状态显示它被重放了多少次。
最佳答案
Storm 本身不为您的问题提供任何支持。因此,定制的解决方案是唯一的出路。即使你不想打补丁 KafkaSpout
,我认为,引入一个计数器并打破其中的重播循环,将是最好的方法。作为替代方案,您也可以从 KafkaSpout
继承。并在您的子类中放置一个计数器。这当然有点类似于补丁,但可能不那么具有侵入性并且更容易实现。
如果您想使用 Bolt,您可以执行以下操作(这也需要对 KafkaSpout
或其子类进行一些更改)。
KafkaSpout
后面插入 bolt 通过 fieldsGrouping
在 ID 上(以确保重放的元组被流式传输到同一个 Bolt 实例)。 HashMap<ID,Counter>
缓冲所有元组并计算(重新)尝试的次数。如果计数器小于您的阈值,则转发输入元组,以便由后面的实际拓扑处理(当然,您需要适本地 anchor 定元组)。如果计数大于您的阈值,确认元组以打破循环并从 HashMap
中删除其条目(您可能还想记录所有失败的元组)。 HashMap
中删除成功处理的元组, 每次在 KafkaSpout
中确认一个元组您需要将元组 ID 转发到 bolt ,以便它可以从 HashMap
中删除元组.只需为您的 KafkaSpout
声明第二个输出流子类化和覆盖 Spout.ack(...)
(当然,您需要调用 super.ack(...)
以确保 KafkaSpout
也得到确认)。 HashMap
中为每个元组设置一个条目的替代方法您还可以使用第三个流(与其他两个流一样连接到 bolt),如果元组失败(即在
Spout.fail(...)
中),则转发一个元组 ID。每次,bolt 收到来自第三个流的“失败”消息,计数器都会增加。只要
HashMap
中没有条目(或未达到阈值),bolt 只是转发元组进行处理。这应该会减少使用的内存,但需要在你的 spout 和 bolt 中实现更多的逻辑。
HashMap
在
KafkaSpout
缓冲失败消息的 ID。因此,如果失败的元组被成功重放,您只能发送“ack”消息。当然,这第三种方法使得要实现的逻辑更加复杂。
KafkaSpout
在某种程度上,我看不到您的问题的解决方案。我个人会修补
KafkaSpout
或者将使用第三种方法与
HashMap
在
KafkaSpout
子类和 bolt (因为与前两种解决方案相比,它消耗的内存很少,并且不会给网络带来很多额外的负载)。
关于apache-kafka - Storm Kafka Spout 上的最大元组重放次数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32912037/
我在 Windows 机器上启动 Kafka-Server 时出现以下错误。我已经从以下链接下载了 Scala 2.11 - kafka_2.11-2.1.0.tgz:https://kafka.ap
关于Apache-Kafka messaging queue . 我已经从 Kafka 下载页面下载了 Apache Kafka。我已将其提取到 /opt/apache/installed/kafka
假设我有 Kafka 主题 cars。 我还有一个消费者组 cars-consumers 订阅了 cars 主题。 cars-consumers 消费者组当前位于偏移量 89。 当我现在删除 cars
我想知道什么最适合我:Kafka 流或 Kafka 消费者 api 或 Kafka 连接? 我想从主题中读取数据,然后进行一些处理并写入数据库。所以我编写了消费者,但我觉得我可以编写 Kafka 流应
我曾研究过一些 Kafka 流应用程序和 Kafka 消费者应用程序。最后,Kafka流不过是消费来自Kafka的实时事件的消费者。因此,我无法弄清楚何时使用 Kafka 流或为什么我们应该使用
Kafka Acknowledgement 和 Kafka 消费者 commitSync() 有什么区别 两者都用于手动偏移管理,并希望两者同步工作。 请协助 最佳答案 使用 spring-kafka
如何在 Kafka 代理上代理 Apache Kafka 生产者请求,并重定向到单独的 Kafka 集群? 在我的特定情况下,无法更新写入此集群的客户端。这意味着,执行以下操作是不可行的: 更新客户端
我需要在 Kafka 10 中命名我的消费者,就像我在 Kafka 8 中所做的一样,因为我有脚本可以嗅出并进一步使用这些信息。 显然,consumer.id 的默认命名已更改(并且现在还单独显示了
1.概述 我们会看到zk的数据中有一个节点/log_dir_event_notification/,这是一个序列号持久节点 这个节点在kafka中承担的作用是: 当某个Broker上的LogDir出现
我正在使用以下命令: bin/kafka-console-producer.sh --broker-list localhost:9092 --topic test.topic --property
我很难理解 Java Spring Boot 中的一些 Kafka 概念。我想针对在服务器上运行的真实 Kafka 代理测试消费者,该服务器有一些生产者已将数据写入/已经将数据写入各种主题。我想与服务
我的场景是我使用了很多共享前缀的 Kafka 主题(例如 house.door, house.room ) 并使用 Kafka 流正则表达式主题模式 API 使用所有主题。 一切看起来都不错,我得到了
有没有办法以编程方式获取kafka集群的版本?例如,使用AdminClient应用程序接口(interface)。 我想在消费者/生产者应用程序中识别 kafka 集群的版本。 最佳答案 目前无法检索
每当我尝试重新启动 kafka 时,它都会出现以下错误。一旦我删除/tmp/kafka-logs 它就会得到解决,但它也会删除我的主题。 有办法解决吗? ERROR Error while
我是 Apache Kafka 的新用户,我仍在了解内部结构。 在我的用例中,我需要从 Kafka Producer 客户端动态增加主题的分区数。 我发现了其他类似的 questions关于增加分区大
正如 Kafka 文档所示,一种方法是通过 kafka.tools.MirrorMaker 来实现这一点。但是,我需要将一个主题(比如 测试 带 1 个分区)(其内容和元数据)从生产环境复制到没有连接
我已经在集群中配置了 3 个 kafka,我正在尝试与 spring-kafka 一起使用。 但是在我杀死 kafka 领导者之后,我无法将其他消息发送到队列中。 我将 spring.kafka.bo
我的 kafka sink 连接器从多个主题(配置了 10 个任务)读取,并处理来自所有主题的 300 条记录。根据每个记录中保存的信息,连接器可以执行某些操作。 以下是触发器记录中键值对的示例: "
我有以下 kafka 流代码 public class KafkaStreamHandler implements Processor{ private ProcessorConte
当 kafka-streams 应用程序正在运行并且 Kafka 突然关闭时,应用程序进入“等待”模式,发送警告日志的消费者和生产者线程无法连接,当 Kafka 回来时,一切都应该(理论上)去恢复正常
我是一名优秀的程序员,十分优秀!