- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在从 eventhub 接收流数据,并且有 4 种类型的数据来自 eventhub。
我正在从 databricks 集群上的事件中心读取数据,如下所示:
ehConf = {}
ehConf['eventhubs.connectionString'] = sc._jvm.org.apache.spark.eventhubs.EventHubsUtils.encrypt(EVENT_HUB_INSTANCE_CONNECTION_STRING)
ehConf['eventhubs.consumerGroup'] = 'ConsumerGroup_1'
spark_df = spark.readStream.format("eventhubs").options(**ehConf).load()
在消息属性中,我有消息类型,因此我使用 Spark where 函数分隔数据,如下所示:
df_type_A = spark_df.select(col("body")).where(spark_df.properties["msgType"]=="TypeA")
df_type_B = spark_df.select(col("body")).where(spark_df.properties["msgType"]=="TypeB")
df_type_C = spark_df.select(col("body")).where(spark_df.properties["msgType"]=="TypeC")
df_type_D = spark_df.select(col("body")).where(spark_df.properties["msgType"]=="TypeD")
然后将数据写入不同的接收器,如下所示:
df_type_A.writeStream\
.format("text")\
.trigger(processingTime='10 seconds')\
.option("checkpointLocation", "/mnt/type_A/Checkpoint")\
.option("path", "/mnt/type_A/Data")\
.start()
df_type_B.writeStream\
.format("text")\
.trigger(processingTime='10 seconds')\
.option("checkpointLocation", "/mnt/type_B/Checkpoint")\
.option("path", "/mnt/type_B/Data")\
.start()
df_type_C.writeStream\
.format("text")\
.trigger(processingTime='10 seconds')\
.option("checkpointLocation", "/mnt/type_C/Checkpoint")\
.option("path", "/mnt/type_C/Data")\
.start()
df_type_D.writeStream\
.format("text")\
.trigger(processingTime='10 seconds')\
.option("checkpointLocation", "/mnt/type_D/Checkpoint")\
.option("path", "/mnt/type_D/Data")\
.start()
据我了解,spark 遵循延迟执行,对于多个接收器,它将创建 4 个不同的 dag 图。 Microsoft 表示“建议每个消费者组的分区上只有一个事件接收器。” ( https://learn.microsoft.com/en-us/azure/event-hubs/event-hubs-features )
为了使一切正常运行,我是否需要在事件中心创建 4 个不同的消费者组并为每种类型(A、B、C、D)编写单独的作业,或者一个消费者组就足够了?
如果创建多个消费者组是唯一的选择,是否可以避免它并有效地完成相同的任务?
编辑:我尝试使用单一消费者组来完成我的 4 项工作,但没有成功。它正在抛出我的新接收器,该接收器具有更高的 epoch_id 和更高的纪元“0”,因此当前接收器“spark-driver-14”与纪元“0”正在断开连接。如果您要重新创建接收器,请确保使用更高的纪元
最佳答案
消费者组是相同数据的另一种 View 。它不是一个允许您将消息路由到特定消费者组的概念。每个消费者组处理所有分区的所有消息。我认为下图很好地说明了这一点:
(取自 the docs )
现在,关于这一点:
it's recommended that there's only one active receiver on a partition per consumer group
接收器会锁定它正在为特定消费者组读取的分区。如果多个接收者从同一分区和消费者组读取数据,他们将竞争获取锁。这是低效的,这就是为什么建议每个消费者组的每个分区有一个事件接收器的原因。
对我来说,你的方法似乎是有效的。不需要多个消费者组。
关于azure - 我是否需要为多个接收器拥有多个事件中心消费者组?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/72001958/
我正在尝试将 WPF CodeBehid 事件(如 Event、Handler、EventSetter)转换为 MVVM 模式。我不允许使用 System.Windows.Controls,因为我使用
我可能误解了 Backbone 中的事件系统,但是当我尝试以下代码时什么也没有发生。当我向 Backbone.Events 扩展对象添加新属性时,它不应该触发某种更改、更新或重置事件吗?就像模型一样吗
我遇到了一个简单的问题,就是无法弄清楚为什么它不起作用。我有一个子组件“app-buttons”,其中我有一个输入字段,我想听,所以我可以根据输入值过滤列表。 如果我将输入放在我有列表的根组件中,一切
System.Timers.Timer 的 Elapsed 事件实际上与 System.Windows.Forms.Timer 的 Tick 事件相同吗? 在特定情况下使用其中一种比使用另一种有优势吗
嗨,这个 javascript 代码段是什么意思。(evt) 部分是如此令人困惑.. evt 不是 bool 值。这个怎么运作? function checkIt(evt) { evt
我正在使用jquery full calendar我试图在事件被删除时保存它。 $('calendar').fullCalendar ({
我有两个链接的鼠标事件: $('body > form').on("mousedown", function(e){ //Do stuff }).on("mouseup", function(
这是我的代码: $( '#Example' ).on( "keypress", function( keyEvent ) { if ( keyEvent.which != 44 ) {
我尝试了 dragOver 事件处理程序,但它没有正常工作。 我正在研究钢琴,我希望能够弹奏音符,即使那个键上没有发生鼠标按下。 是否有事件处理程序? 下面是我正在制作的钢琴的图片。 最佳答案 您应该
当悬停在相邻文本上时,我需要使隐藏按钮可见。这是通过 onMouseEnter 和 onMouseLeave 事件完成的。但是当点击另外的文本时,我需要使按钮完全可见并停止 onMouseLeave
我有ul标签内 div标签。我申请了mouseup事件 div标记和 click事件 ul标签。 问题 每当我点击 ul标签,然后都是 mouseup和 click事件被触发。 我想要的是当我点击 u
我是 Javascript 和 jQuery 的新手,所以我有一个非常愚蠢的疑问,请耐心等待 $(document).click(function () { alert("!"); v
我有一个邮政编码解析器,我正在使用 keyup 事件处理程序来跟踪输入长度何时达到 5,然后查询服务器以解析邮政编码。但是我想防止脚本被不必要地调用,所以我想知道是否有一种方法可以跟踪 keydown
使用事件 API,我有以下代码来发布带有事件照片的事件 $facebook = new Facebook(array( "appId" => "XXX", "se
首次加载 Microsoft Word 时,既不会触发 NewDocument 事件也不会触发 DocumentOpen 事件。当 Word 实例已打开并打开新文档或现有文档时,这些事件会正常触发。
我发现了很多相关问题(这里和其他地方),但还没有具体找到这个问题。 我正在尝试监听箭头键 (37-40) 的按键事件,但是当以特定顺序使用箭头键时,后续箭头不会生成“按键”事件。 例子: http:/
给定的 HTML: 和 JavaScript 的: var $test = $('#test'); $test.on('keydown', function(event) { if (eve
我是 Node.js 的新手,希望使用流运行程序。对于其他程序,我必须同时启动一个服务器(mongodb、redis 等),但我不知道我是否应该用这个运行一个服务器。请让我知道我哪里出了问题以及如何纠
我正在尝试使用 Swift 和 Cocoa 创建一个适用于 OS X 的应用程序。我希望应用程序能够响应关键事件,而不将焦点放在文本字段上/文本字段中。我在 Xcode 中创建了一个带有 Storyb
我有以下代码: (function(w,d,s,l,i){ w[l]=w[l]||[];w[l].push({
我是一名优秀的程序员,十分优秀!