stream - 创建一个每 X 秒发出一次元组的 Apache Storm spout-6ren

stream - 创建一个每 X 秒发出一次元组的 Apache Storm spout

转载作者：行者123 更新时间：2023-12-01 02:13:59

25

4

我有一个从 MQTT 代理接收数据的拓扑，我想要一个 spout 的行为如下:

每 x 秒发出一批元组(或单个元组中的字符串列表)。我如何实现这一目标？我读了一些关于 Storm 三叉戟的文章，但它是 IBatchSpout似乎不允许我以特定的时间间隔批量发出元组。

如果没有新数据进来，Spout 应该怎么做？它不能阻塞线程，因为它是 Storm 的主线程，对吧？

最佳答案

您可以实现自己的 MQTT 喷口。举个例子，看看 MongoSpout .

重要的部分是 nextTuple 方法。

When this method is called, Storm is requesting that the Spout emit tuples to the output collector. This method should be non-blocking, so if the Spout has no tuples to emit, this method should return. nextTuple, ack, and fail are all called in a tight loop in a single thread in the spout task. When there are no tuples to emit, it is courteous to have nextTuple sleep for a short amount of time (like a single millisecond) so as not to waste too much CPU.

您不能立即等待指定的时间，但您可以执行 nextTuple这样它只偶尔发出一个元组。

private static final EMISSION_PERIOD = 2000; // 2 seconds
private long lastEmission;

@Override
public void nextTuple() {
    if (lastEmission == null ||
            lastEmission + EMISSION_PERIOD >= System.currentMillis()) {
        List<Object> tuple = pollMQTT();
        if (tuple != null) {
            this.collector.emit(tuple);
            return;
        }
    }
    Utils.sleep(50);
}

请注意，我找到了一个开源 MQTT spout .它看起来没有做好生产准备，但您可以将其用作起点。

关于stream - 创建一个每 X 秒发出一次元组的 Apache Storm spout，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/26595148/

25

4

0

文章推荐： jquery - 如何在 jQuery Mobile 中获取选中的单选按钮值？

文章推荐： python - 使用 Panda 和 Matplotlib 绘制 2 个堆叠系列

文章推荐： linux-kernel - Linux 中的 "lock"方法保证原子性？

文章推荐： arrays - AngularJs ng-repeat 表中的二维数组，每个子数组一列

java - 如何让一个 spout 等待另一个 spout？
我有一个用例，我想等待一个 spout 发出并开始从其他 spout 监听 kafka。这在 Storm 中可能吗？例如:Spout A 做一些处理并发出 done，一旦我收到 done 消息，Sp
java - Spout 作为套接字监听器
由于 Spouts 中不允许阻塞进程，那么将 Spout 实现为 Socket 监听器以接收 DataGram 数据包的最佳方法是什么？最佳答案最著名的软件开发规则之一是: We can solv
PHP spout 读/写速度
我正在使用 spout 库在 PHP 中读取和写入 excel 文件。我只是有一个关于速度的问题。当我尝试读/写 100k 条记录时，只用了 15 分钟当我尝试读/写 20 万条记录时，现在需要
lifecycle - 对于Storm Spouts，何时调用declareOutputFields()？
我想知道 Storm Spout 上的各种方法何时被调用。我看过ISpout javadoc ，这给了我以下思维模型: "instantiated" -- open(...) -----> "act
java - 比较不透明或事务性 Kafka spout
OpaqueTridentKafkaSpout 和 TransactionalTridentKafkaSpout 有什么区别？你什么时候会用一个而不是另一个？最佳答案不在于哪个更好，而在于你的需求
java - Storm Spout/拓扑性能
我遇到 Apache Storm 性能问题，主要来自 spout。我有一个从 kestrel 队列中发出项目的拓扑。我获取大约 2000 个项目，每次在 spout 中调用 nextTuple 时，
php - box/spout - 卡住电子表格的第一行( Pane )
是否可以使用框/喷口卡住电子表格的第一行(卡住 Pane )？使用 PHPexcel，我确实喜欢这样: $objPHPExcel=new PHPExcel(); $ActiveSheet=$objP
apache-storm - 是否可以在一个拓扑中创建多个 spout？如何？
我有两个主题 BACKUPDATA 和 LIVEDATA。阅读这两个主题的最佳解决方案是什么？ 1. 两种不同的拓扑？ 2. 一种拓扑有两个 spout？我尝试了两种不同的拓扑，但 Storm 没
apache-storm - Kafka Spout 的字段分组
可以对 kafka spout 发出的元组进行字段分组吗？如果是，那么 Storm 如何知道 Kafka 记录中的字段？最佳答案 Storm 中的字段分组(和一般的分组)是针对 bolt 的，而不是
java - Storm Kafka-Spout 无法正常工作
一般:我是一名学生，想要在 Storm/Kafka/Flink/MS Azure SA/Spark 上运行一些性能测试(WordCount)。我想使用 Kafka Broker 作为输入源。我使用了
java - 无法读取 Storm Spout 中的输入文件
我有一个 Storm Spout，它将从日志文件中读取。因此，当我在本地测试代码时，它运行良好，因为我在运行作业时传递运行时参数。但是当我在集群中部署代码时，它给出了 FileNotFoundExc
java - Apache Storm spout 可以相互通信吗？
我有一个目录，另一个进程将文件放入其中。我们当前的 Storm 实现读取此目录并选择最旧的文件并打开文件读取器。该读取器作为 spout 中的一个字段保存，因此当调用 nextTuple() 时，将
java - Storm Spout 没有得到 Ack
我已经开始使用 storm，所以我使用 this tutorial 创建了简单的拓扑当我使用 LocalCluster 运行我的拓扑时，一切看起来都很好，我的问题是我没有在元组上收到 ACK，这意味
hadoop - Storm spout NullPointerException - 异步循环终止
我是 Storm 的初学者。我正在尝试执行下面的示例程序 How to create a topology in storm SampleSpout.java import java.util.
java - 如何将两个不同 Spout 的输出发送到同一个 Bolt？
我有两个 Kafka Spouts，我想将它们的值发送到同一个 bolt。这可能吗？最佳答案是的，这是可能的: TopologyBuilder b = new TopologyBuilder()
apache-storm - 为什么我不应该在 Spout.nextTuple() 中循环或阻塞
我看到很多代码片段，其中在 Spout.nextTuple() 中使用了循环。 (例如读取整个文件并为每一行发出一个元组): public void nextTuple() { // do o
apache-kafka - Storm Kafka Spout 上的最大元组重放次数
我们将 Storm 与 Kafka Spout 一起使用。当消息失败时，我们希望重放它们，但在某些情况下，坏数据或代码错误会导致消息始终无法通过 Bolt，因此我们将进入无限重放循环。显然，当我们发现
apache-storm - Storm-kafka spout 消耗缓慢
我只是在尝试这里提到的 kafka-storm spout https://github.com/nathanmarz/storm-contrib/tree/master/storm-kafka我使用
java - Apache Storm - Spout/Bolt 因高延迟而崩溃
在我的拓扑中使用 Storm 1.1.0 时，我遇到了这样的问题:当拓扑具有高延迟的 Bolt 时，Storm 会重新调度或让 Bolt 和 Spouts 崩溃。现在我创建了一个 LatencyTe
java - Storm Bolt 无法从 Spout 反序列化对象
我正在使用 Storm 1.1.2、JDK 8(Storm 不喜欢 JDK 9 编译的代码)、Kafka 0.11 和 Docker Compose 制作一个 Spring 应用程序。这个想法是拥有

首页

博学

6Ren·AI

商城

stream - 创建一个每 X 秒发出一次元组的 Apache Storm spout