- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
上下文:处理来自 Kafka 的数据并将结果发送回 Kafka。
问题:每个事件都可能需要几秒钟的时间来处理(正在进行改进)。在那段时间里,事件(和 RDD)确实会累积。不必处理中间事件(按键),只需处理最后一个事件。因此,当一个进程完成时,Spark Streaming 最好跳过所有不是当前最后一个事件的事件(按键)。
我不确定仅使用 Spark Streaming API 是否可以完成该解决方案。我对Spark Streaming的理解,DStream RDD会一个一个累加处理,后面有其他的不考虑。
可能的解决方案:
仅使用 Spark Streaming API,但我不确定如何使用。 updateStateByKey
似乎是一个解决方案。但我不确定当 DStream RDD 累积时它是否会正常工作,你必须只按键处理持续事件。
有两个 Spark Streaming 管道。一个通过键获取最后更新的事件,将其存储在 map 或数据库中。第二个管道仅在它们是另一个管道指示的最后一个事件时才处理事件。子问题:
两个管道是否可以共享相同的 sparkStreamingContext
并以不同的速度处理相同的 DStream(低处理速度与高速处理速度)?
是否可以在不使用外部数据库的情况下轻松地在管道之间共享值(例如 map )?我认为累加器/广播可以工作,但我不确定在两个管道之间。
最佳答案
考虑到流式传输是一个连续的过程,因此很难定义“最后”在这种情况下的含义。但是,假设您想要在给定时间段内处理最后一个事件,例如每 10 秒运行一次处理,并且在这 10 秒帧中只为每个键获取最后一个事件 - 有几种可能的方法。
其中一个选项是在 DStream
上创建 window:
val windowStream = dStream.window(Seconds(10), Seconds(10))
windowStream.forEachRDD { /* process only latest events */ }
在这种情况下,windowStream 将拥有 RDD,它结合了过去 10 秒内所有 RDD 的键/值,您可以在 forEachRDD
中访问所有这些键/值,就好像您最初将它们放在单个 RDD 中一样。缺点是它不会提供有关事件如何进入流的事件排序的任何信息,但您可能在值中有事件时间信息或重用 Kafka 的偏移量
基本上就像您建议的那样 - 它可以让您积累值(value)。Databricks 有一个很好的例子来说明如何做到这一点 here
虽然他们在示例中进行累加,但您可以只更新键的值
虽然这不会取代在 Spark 端处理它的需要,但如果您将事件保留在 Kafka 中一段时间,您可能需要考虑使用 Kafka 的 Log Compaction它不能保证重复项不会从 Kafka 进入 Spark 流,但会通过仅在日志尾部保留最新键来减少 Kafka 中存储的事件数量。
关于apache-spark - 如何只处理最后的、最相关的事件(并在延迟增长太快时跳过其他事件)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34635795/
我正在尝试将 WPF CodeBehid 事件(如 Event、Handler、EventSetter)转换为 MVVM 模式。我不允许使用 System.Windows.Controls,因为我使用
我可能误解了 Backbone 中的事件系统,但是当我尝试以下代码时什么也没有发生。当我向 Backbone.Events 扩展对象添加新属性时,它不应该触发某种更改、更新或重置事件吗?就像模型一样吗
我遇到了一个简单的问题,就是无法弄清楚为什么它不起作用。我有一个子组件“app-buttons”,其中我有一个输入字段,我想听,所以我可以根据输入值过滤列表。 如果我将输入放在我有列表的根组件中,一切
System.Timers.Timer 的 Elapsed 事件实际上与 System.Windows.Forms.Timer 的 Tick 事件相同吗? 在特定情况下使用其中一种比使用另一种有优势吗
嗨,这个 javascript 代码段是什么意思。(evt) 部分是如此令人困惑.. evt 不是 bool 值。这个怎么运作? function checkIt(evt) { evt
我正在使用jquery full calendar我试图在事件被删除时保存它。 $('calendar').fullCalendar ({
我有两个链接的鼠标事件: $('body > form').on("mousedown", function(e){ //Do stuff }).on("mouseup", function(
这是我的代码: $( '#Example' ).on( "keypress", function( keyEvent ) { if ( keyEvent.which != 44 ) {
我尝试了 dragOver 事件处理程序,但它没有正常工作。 我正在研究钢琴,我希望能够弹奏音符,即使那个键上没有发生鼠标按下。 是否有事件处理程序? 下面是我正在制作的钢琴的图片。 最佳答案 您应该
当悬停在相邻文本上时,我需要使隐藏按钮可见。这是通过 onMouseEnter 和 onMouseLeave 事件完成的。但是当点击另外的文本时,我需要使按钮完全可见并停止 onMouseLeave
我有ul标签内 div标签。我申请了mouseup事件 div标记和 click事件 ul标签。 问题 每当我点击 ul标签,然后都是 mouseup和 click事件被触发。 我想要的是当我点击 u
我是 Javascript 和 jQuery 的新手,所以我有一个非常愚蠢的疑问,请耐心等待 $(document).click(function () { alert("!"); v
我有一个邮政编码解析器,我正在使用 keyup 事件处理程序来跟踪输入长度何时达到 5,然后查询服务器以解析邮政编码。但是我想防止脚本被不必要地调用,所以我想知道是否有一种方法可以跟踪 keydown
使用事件 API,我有以下代码来发布带有事件照片的事件 $facebook = new Facebook(array( "appId" => "XXX", "se
首次加载 Microsoft Word 时,既不会触发 NewDocument 事件也不会触发 DocumentOpen 事件。当 Word 实例已打开并打开新文档或现有文档时,这些事件会正常触发。
我发现了很多相关问题(这里和其他地方),但还没有具体找到这个问题。 我正在尝试监听箭头键 (37-40) 的按键事件,但是当以特定顺序使用箭头键时,后续箭头不会生成“按键”事件。 例子: http:/
给定的 HTML: 和 JavaScript 的: var $test = $('#test'); $test.on('keydown', function(event) { if (eve
我是 Node.js 的新手,希望使用流运行程序。对于其他程序,我必须同时启动一个服务器(mongodb、redis 等),但我不知道我是否应该用这个运行一个服务器。请让我知道我哪里出了问题以及如何纠
我正在尝试使用 Swift 和 Cocoa 创建一个适用于 OS X 的应用程序。我希望应用程序能够响应关键事件,而不将焦点放在文本字段上/文本字段中。我在 Xcode 中创建了一个带有 Storyb
我有以下代码: (function(w,d,s,l,i){ w[l]=w[l]||[];w[l].push({
我是一名优秀的程序员,十分优秀!