- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
(还有几个关于超时和 maxSpoutPending 的问题)
我在 Storm 文档中看到很多关于消息被完全处理的引用。但是我的 KafkaSpout 如何知道消息何时被完全处理?
希望它知道我的 bolt 连接方式,所以当我的 Stream 中的最后一个 bolt 确认一个元组时,spout 知道我的消息何时被处理?
否则,我会想象在超时期限到期后,将检查消息的确认状态,如果确认/ anchor 定 XOR 指示,则将其视为已处理。但我希望不是这样?
我也有关于 maxTuplesPending 和超时配置的相关问题。
如果我将 maxTuplePending 设置为 10k,那么我是否认为每个 spout 实例将继续发出元组,直到该 spout 实例正在跟踪 10k 元组,10k 元组尚未完全处理?然后当当前正在传输的消息被完全处理时会发出一个新的元组?
最后,这与超时配置有关吗?在发送新消息之前,spout 是否以任何方式等待配置的超时发生?或者超时配置是否仅在消息被停止/处理缓慢时才起作用,导致由于超时而失败?
更简洁(或者希望更清楚),将我的超时设置为 30 分钟是否有影响,除非消息在 30 分钟内被最终 Bolt 确认,否则消息不会失败?或者是否有其他影响,例如超时配置会影响 spouts 的发射率?
抱歉问了这么长、漫无目的的问题。提前感谢您的任何回复。
*编辑以进一步澄清
这对我来说是一个问题,因为我的消息不一定贯穿整个 Stream。
假设我有 bolt A、B、C、D。大多数情况下,消息将从 A->B->->D 传递。但是我有一些消息会故意停止在 bolt A 上。 A 会确认它们但不会发出它们(因为我的业务逻辑,在这些情况下,我确实希望对消息进行进一步处理)。
那么我的 KafkaSpout 会知道已确认但未从 A 发出的消息已完全处理吗?因为我希望在 Bolt A 完成后立即从 spout 发出另一条消息,在这种情况下。
最佳答案
Storm 通过 UDF 代码必须使用的 anchor 定机制跟踪整个拓扑中的元组。这种 anchor 定导致了所谓的元组树,树的根是 spout 发出的元组,所有其他节点(在树结构中连接)表示从使用输入元组作为 anchor 的 bolts 发出的元组(这只是一个逻辑模型,并没有在 Storm 中以这种方式实现,尽管如此)。
例如,Spout 发出一个句子元组,该元组被单词中的第一个 bolt 分割,一些单词由第二个 bolt 过滤,并且单词计数由第三个 bolt 应用。最后,sink bolt 将结果写入文件。这棵树看起来像这样:
"this is an example sentence" -+-> "this"
+-> "is"
+-> "an"
+-> "example" -> "example",1 -> "example",1
+-> "sentence" -> "sentence",1 -> "sentence",1
Spout.ack(MessageId)
的回调用发生(即,当元组被完全处理时,回调用立即完成)。此外,ackers 会定期检查是否存在由 acker 注册的元组超过超时时间。如果发生这种情况,acker 会丢弃元组 ID,并向 spout 发送一条消息,表示元组失败(导致调用
Spout.fail(MessageId)
)。
Spout.nextTuple()
参数,则停止调用
maxTuplesPending
。据我所知,该参数是全局应用的,即每个 spout 任务的本地计数相加,并将全局计数与参数进行比较(但不确定具体是如何实现的)。
timeout
参数独立于
maxTuplesPending
。
关于apache-storm - Storm 如何知道消息何时是 "fully processed"?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33546052/
关闭。这个问题是opinion-based .它目前不接受答案。 想改善这个问题吗?更新问题,以便可以通过 editing this post 用事实和引文回答问题. 5年前关闭。 Improve t
我是一名设计老师,试图帮助学生应对编程挑战,所以我编码是为了好玩,但我不是专家。 她需要找到 mode (最常见的值)在使用耦合到 Arduino 的传感器的数据构建的数据集中,然后根据结果激活一些功
我正在开发一个应用程序,该应用程序提供 CPU 使用率最高的 5 个应用程序名称。目前,我通过以下代码获得了排名前 5 的应用程序: var _ = require('lodash');
互联网上很少有例子涉及这个问题的所有三个问题——即 set-process-sentinel ; set-process-filter ;和 start-process . 我尝试了几种不同的方法来微
如 this post 中所述,在 C# 中有两种调用另一个进程的方法。 Process.Start("hello"); 和 Process p = new Process(); p.StartInf
我试图让我的桨从白色变为渐变(线性),并使球具有径向渐变。感谢您的帮助!您可以在 void drawPaddle 中找到桨的代码。 这是我的目标: 这是我的代码: //球 int ballX = 50
考虑:流程(a)根据我的文字: A process is first entered at the time of simulation, at which time it is executed u
我真的希望 Processing 有用于处理数组的 push 和 pop 方法,但由于它没有,我不得不试图找出删除数组中特定位置的对象的最佳方法。我相信这对很多人来说都是基本的,但我可以使用一些帮助,
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 10 年前。 Improve thi
以编程方式,我如何确定 Windows 10 中的 3 个类别 应用 后台进程 Windows 服务 就像任务管理器一样? 即我需要一些 C# 代码,我可以确定应用程序列表与后台进程列表。检查 Win
当我导入 node:process它工作正常。但是,当我尝试要求相同时,它会出错。 这工作正常: import process from 'node:process'; 但是当我尝试要求相同时,它会引
我正在上一门使用处理的类(class)。 我在理解 map() 函数时遇到问题。 根据它的文档( http://www.processing.org/reference/map_.html ): Re
我试图执行: composer.phar update 并收到: Fatal error: Allowed memory size of 94371840 bytes exhausted (tried
给定一堆二维图像,如何使用 Processing/Processing.js 产生体积渲染效果? 目前我的想法是使用 java(类似于 imageJ)进行体积渲染 -> 获取体积渲染图像的面作为单独的
这是代码示例 var startInfo = new ProcessStartInfo { Arguments = commandStr, FileName = @"C:\Window
当我在 Processing(草图 > 导入库 > 添加库)中添加库时,它安装在哪里? 最佳答案 它们安装在您的 中速写本位置 . 您可以通过转到"file">“首选项”来查看和更改您的速写本位置。草
无聊的好奇... 我正在查看当前进程的一些属性: using(Process p = Process.GetCurrentProcess()) { // Inspect properties
我正在尝试在同一页面上运行多个草图。 初始化脚本指定: /* * This code searches for all the * in your page and loads each scrip
Process.Kill 后是否需要使用 Process.WaitForExit? 如果调用进程在调用 Process.Kill 后立即退出怎么办? 这会导致 Process.Kill 失败吗? 编辑
我尝试使用处理从麦克风获取频率。我混合了文档中的两个示例,但“最高”并不是真正的赫兹(a 是 440 赫兹)。 你知道如何拥有比这更好的东西吗? import ddf.minim.*; import
我是一名优秀的程序员,十分优秀!