java - Apache Storm : Mutable Object emitted to different bolts-6ren

java - Apache Storm : Mutable Object emitted to different bolts

转载作者：行者123 更新时间：2023-11-30 10:42:30

27

4

几周以来，我们在项目中使用了 Storm。今天，我们发现了一个非常奇怪的行为。假设我们有以下拓扑:

SpoutA ---> BoltB
       ---> BoltC

因此，我们有一个 SpoutA，它向两个不同的 Bolt 发出自定义 Java 对象(我们称之为消息)。 bolt B 和 bolt C。基本上，我们执行拆分。

直到今天，我们假设如果 SpoutA 发出消息对象，它会在 SpoutA 上序列化并在 BoltB 和 BoltC 上反序列化。然而，这个假设似乎是错误的。今天，我们发现BoltB中的反序列化对象与BoltC中的对象完全相同(Same System.identitfyHashCode)。换句话说，如果我操作了BoltB中的Object，我也操作了BoltC中的Object，导致许多不可预见的副作用。

此外，这种行为对我来说似乎很奇怪，因为它只适用于 SpoutA 和相应的 Bolt B 和 C 在同一个 worker 中运行的情况。如果我明确强制使用三个作品，那么该对象(正如预期的那样)是 BoltB 和 BoltC 的不同对象，因为它用于不同的 JVM。因此，如果我们假设我们有一个更大的拓扑(50 个不同的 bolts)在三个 worker 上运行，那么我们永远无法确定对象当前是否在 bolts 之间共享。

所以基本上，我们真的不希望在 bolt 之间共享一个对象。我们通常期望在反序列化过程中，为每个 bolt 创建新的不同对象。

所以这是我的问题:我们这里的主要缺陷是什么？我们发出“可变”对象是我们的主要缺陷吗？我们使用序列化/反序列化错误吗？或者它甚至可能是 Storm 的设计缺陷？

显然，我们可以通过仅发出字节数组来强制创建新对象，但我认为这与 Storm 相矛盾。

最好的问候，安德烈

最佳答案

Storm 在将元组从一个组件移动到另一个组件时使用两种不同的排队方法，一种是两个组件位于同一 JVM 内，另一种是元组必须跨 JVM 传输。我认为您陷入了同一个 JVM 的情况，其中元组中的对象实际上并未序列化，因为只有跨 JVM 队列才需要序列化。

我总是对元组和 Java bean 之间的数据进行编码和解码，以便在每个 bolt/spout 中为我的业务逻辑提供强类型接口(interface)。这样做我想我无意中避免了你遇到的问题。这可能是解决您的问题的一种方法。

关于java - Apache Storm : Mutable Object emitted to different bolts，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/38105443/

27

4

0

文章推荐： java - 如何从 java 代码在 jboss cli 中启动嵌入式服务器？

文章推荐： javascript - 想要将自动播放设置添加到响应式图片库。

文章推荐： swift - 当我向下滚动时 viewController 晃动

apache-storm - Storm 用户界面不工作
我们正在以伪模式执行 Storm 拓扑。 Storm 拓扑运行良好，能够连接 Storm UI (8080)。但是Storm UI 没有显示正在运行的拓扑信息。也重新启动了 Storm UI 进程
apache-storm - Storm 拓扑中的可选流
我们有一个相当简单的 Storm 拓扑，让人头疼。我们的一个 bolt 可以发现它正在处理的数据是有效的，并且每件事都正常进行，或者它可以发现它是无效但可以修复的。在这种情况下，我们需要将其发送以进
apache-storm - Storm 中的三叉戟状态是什么？
我是 Storm 中 Trident 的新手。我对 TridentState 感到很头疼。据我了解，三叉戟维护每个批次的状态(即元数据)(批次中的所有元组是否都通过在数据库中维护事务 ID 来完全处理
apache-storm - Storm 场分组
我有以下情况: 有许多 bolt 计算不同的值该值被发送到可视化 bolt 可视化 bolt 打开一个网络套接字并发送值以某种方式可视化问题是，可视化 bolt 总是相同的，但它为可以作为其输入的
apache-storm - Storm 场分组示例
我正在使用 Kafka storm，kafka 向 storm 发送/发出 json 字符串，在 storm 中，我想根据 json 中的键/字段将负载分配给几个工作人员。怎么做？在我的例子中，它是
apache-storm - Storm 支持类似批处理的处理
我需要使用 Storm 处理成批的元组。我的最后一个 bolt 必须等到拓扑接收到整个批次，然后才能进行一些处理。为避免混淆 - 对我来说，批处理是一组实时出现的 N 条消息，该术语不必与批处理 (H
apache-storm - Storm 中的连接被拒绝错误
我是 Storm 的新手..我遇到了以下错误 java.net.ConnectException: Connection refused at sun.nio.ch.SocketChannel
apache-storm - Storm - 主管在重启时崩溃
这是一个让我发疯的问题。我的本地 LAN 上运行着一台机器 Storm 实例。我目前正在运行 v0.9.1-incubating发布版本(来自 the Apache Incubator site。问题
apache-storm - Storm ClassNotFoundException
我是第一次使用 Storm(从开始使用 Storm 学习)，我的项目在运行时失败并出现 ClassNotFoundException: [WARNING] java.lang.ClassNotFoun
apache-storm - Storm 拓扑配置
如何为 Storm 拓扑提供自定义配置？例如，如果我构建了一个连接到 MySQL 集群的拓扑，并且我希望能够在不重新编译的情况下更改需要连接的服务器，我该怎么做？我的偏好是使用配置文件，但我担心文件本
apache-storm - Storm 好用吗？
我一直在阅读 Storm并尝试使用 Storm-starter 中的示例。我想我明白了这个概念，它非常适用于许多情况。我有一个我想做的测试项目来了解更多关于这方面的信息，但我想知道 Storm 是否
apache-storm - Storm 中的背压
在我们的 Storm 1.0.2 应用程序中，我们面临内存不足的异常。在调试时，我们发现 Kafka spout 向 Bolt 发出了太多消息。 bolt 的运行能力几乎为 4.0。那么有没有一种方法
apache-storm - 三叉戟拓扑中的并行配置( Storm )
看完this和 this我很难理解如何配置我的三叉戟拓扑。基本上我的 Storm 应用程序正在读取 kafka ，进行一些数据操作，最后写入 Cassandra . 这是我目前构建拓扑的方式: pr
apache-storm - build Storm 启动器 : getting error "POM for storm-core missing"
我已经从 https://github.com/apache/incubator-storm 下载了 incubator-storm 代码.现在，我尝试使用以下命令运行 WordCountTopolo
apache-storm - 了解 Storm 架构
我一直在努力理解 Storm 架构，但我不确定我是否理解正确。我会尽量准确地解释我认为的情况。请解释什么 - 如果 - 我错了，什么是对的。初步想法: worker http://storm.apa
apache-storm - 重新平衡后 Storm 任务状态会转移到新的执行器吗？
这是我阅读后想到的一个问题: What is the "task" in Storm parallelism 如果我需要在 bolt 的内部状态中保留一些信息，例如，在经典的单词计数用例中，将 bol
apache-storm - Apache Storm 无法从种子主机中找到领导者灵气
我已经使用 docker compose 安装了 Apache-Storm docker-compose.yml: kafka: image: spotify/kafka ports:
apache-storm - 以编程方式获取 Storm 拓扑统计信息
我正在围绕我的 Storm 拓扑构建一个监控服务，并希望能够获取各个时间窗口周围的失败元组数量，类似于 Storm UI 如何在 10m、3h 和 1d 窗口中显示失败元组的数量。我的监控服务目前是
apache-storm - 向 Storm 提交拓扑
我已经在我的机器上配置了 Storm。 Zookeeper、Nimbus 和 Supervisor 运行正常。现在我想向这个 Storm 提交一个拓扑。我正在尝试使用 Storm jar 。但我
apache-storm - (Twitter) Storm 的聚合窗口
我在玩 Storm，我想知道 Storm 在哪里指定(如果可能)聚合时的(翻滚/滑动)窗口大小。例如。如果我们想在 Twitter 上找到前一小时的热门话题。我们如何指定一个 bolt 应该每小时返回

首页

博学

6Ren·AI

商城

java - Apache Storm : Mutable Object emitted to different bolts