apache-spark - 为 kafka 主题 : No current assignment for partition topic1 分配新分区(旧分区被撤销)后，Spark Streaming 作业失败-6ren

apache-spark - 为 kafka 主题 : No current assignment for partition topic1 分配新分区(旧分区被撤销)后，Spark Streaming 作业失败

转载作者：行者123 更新时间：2023-12-05 07:35:36

在 kafka 中使用 spark streaming 并使用以下代码创建直接流-

val kafkaParams = Map[String, Object](
  "bootstrap.servers" -> conf.getString("kafka.brokers"),
  "zookeeper.connect" -> conf.getString("kafka.zookeeper"),
  "group.id" -> conf.getString("kafka.consumergroups"),
  "auto.offset.reset" -> args { 1 },
  "enable.auto.commit" -> (conf.getString("kafka.autoCommit").toBoolean: java.lang.Boolean),
  "key.deserializer" -> classOf[StringDeserializer],
  "value.deserializer" -> classOf[StringDeserializer],
  "security.protocol" -> "SASL_PLAINTEXT",
  "session.timeout.ms" -> args { 2 },
  "max.poll.records" -> args { 3 },
  "request.timeout.ms" -> args { 4 },
  "fetch.max.wait.ms" -> args { 5 })

val messages = KafkaUtils.createDirectStream[String, String](
  ssc,
  LocationStrategies.PreferConsistent,
  ConsumerStrategies.Subscribe[String, String](topicsSet, kafkaParams))

经过一些处理后，我们使用 commitAsync API 提交偏移量。

try
{
messages.foreachRDD { rdd =>
  val offsetRanges = rdd.asInstanceOf[HasOffsetRanges].offsetRanges
  messages.asInstanceOf[CanCommitOffsets].commitAsync(offsetRanges)
}
}
catch
{   
 case e:Throwable => e.printStackTrace()
}

以下错误导致作业崩溃-

            18/03/20 10:43:30 INFO ConsumerCoordinator: Revoking previously assigned partitions [TOPIC_NAME-3, TOPIC_NAME-5, TOPIC_NAME-4] for group 21_feb_reload_2
            18/03/20 10:43:30 INFO AbstractCoordinator: (Re-)joining group 21_feb_reload_2
            18/03/20 10:43:30 INFO AbstractCoordinator: (Re-)joining group 21_feb_reload_2
            18/03/20 10:44:00 INFO AbstractCoordinator: Successfully joined group 21_feb_reload_2 with generation 20714
            18/03/20 10:44:00 INFO ConsumerCoordinator: Setting newly assigned partitions [TOPIC_NAME-1, TOPIC_NAME-0, TOPIC_NAME-2] for group 21_feb_reload_2
            18/03/20 10:44:00 ERROR JobScheduler: Error generating jobs for time 1521557010000 ms
            java.lang.IllegalStateException: No current assignment for partition TOPIC_NAME-4
                at org.apache.kafka.clients.consumer.internals.SubscriptionState.assignedState(SubscriptionState.java:251)
                at org.apache.kafka.clients.consumer.internals.SubscriptionState.needOffsetReset(SubscriptionState.java:315)
                at org.apache.kafka.clients.consumer.KafkaConsumer.seekToEnd(KafkaConsumer.java:1170)
                at org.apache.spark.streaming.kafka010.DirectKafkaInputDStream.latestOffsets(DirectKafkaInputDStream.scala:197)
                at org.apache.spark.streaming.kafka010.DirectKafkaInputDStream.compute(DirectKafkaInputDStream.scala:214)
                at org.apache.spark.streaming.dstream.DStream$$anonfun$getOrCompute$1$$anonfun$1$$anonfun$apply$7.apply(DStream.scala:341)
                at org.apache.spark.streaming.dstream.DStream$$anonfun$getOrCompute$1$$anonfun$1$$anonfun$apply$7.apply(DStream.scala:341)
                at scala.util.DynamicVariable.withValue(DynamicVariable.scala:58)
                at org.apache.spark.streaming.dstream.DStream$$anonfun$getOrCompute$1$$anonfun$1.apply(DStream.scala:340)
                at org.apache.spark.streaming.dstream.DStream$$anonfun$getOrCompute$1$$anonfun$1.apply(DStream.scala:340)
                at org.apache.spark.streaming.dstream.DStream.createRDDWithLocalProperties(DStream.scala:415)
                at org.apache.spark.streaming.dstream.DStream$$anonfun$getOrCompute$1.apply(DStream.scala:335)
                at org.apache.spark.streaming.dstream.DStream$$anonfun$getOrCompute$1.apply(DStream.scala:333)
                at scala.Option.orElse(Option.scala:289)
                at org.apache.spark.streaming.dstream.DStream.getOrCompute(DStream.scala:330)
                at org.apache.spark.streaming.dstream.MappedDStream.compute(MappedDStream.scala:36)
                at org.apache.spark.streaming.dstream.DStream$$anonfun$getOrCompute$1$$anonfun$1$$anonfun$apply$7.apply(DStream.scala:341)
                at org.apache.spark.streaming.dstream.DStream$$anonfun$getOrCompute$1$$anonfun$1$$anonfun$apply$7.apply(DStream.scala:341)
                at scala.util.DynamicVariable.withValue(DynamicVariable.scala:58)
                at org.apache.spark.streaming.dstream.DStream$$anonfun$getOrCompute$1$$anonfun$1.apply(DStream.scala:340)
                at org.apache.spark.streaming.dstream.DStream$$anonfun$getOrCompute$1$$anonfun$1.apply(DStream.scala:340)
                at org.apache.spark.streaming.dstream.DStream.createRDDWithLocalProperties(DStream.scala:415)
                at org.apache.spark.streaming.dstream.DStream$$anonfun$getOrCompute$1.apply(DStream.scala:335)
                at org.apache.spark.streaming.dstream.DStream$$anonfun$getOrCompute$1.apply(DStream.scala:333)
                at scala.Option.orElse(Option.scala:289)
                at org.apache.spark.streaming.dstream.DStream.getOrCompute(DStream.scala:330)
                at org.apache.spark.streaming.dstream.ForEachDStream.generateJob(ForEachDStream.scala:48)
                at org.apache.spark.streaming.DStreamGraph$$anonfun$1.apply(DStreamGraph.scala:117)
                at org.apache.spark.streaming.DStreamGraph$$anonfun$1.apply(DStreamGraph.scala:116)
                at scala.collection.TraversableLike$$anonfun$flatMap$1.apply(TraversableLike.scala:241)
                at scala.collection.TraversableLike$$anonfun$flatMap$1.apply(TraversableLike.scala:241)
                at scala.collection.mutable.ResizableArray$class.foreach(ResizableArray.scala:59)
                at scala.collection.mutable.ArrayBuffer.foreach(ArrayBuffer.scala:48)
                at scala.collection.TraversableLike$class.flatMap(TraversableLike.scala:241)
                at scala.collection.AbstractTraversable.flatMap(Traversable.scala:104)
                at org.apache.spark.streaming.DStreamGraph.generateJobs(DStreamGraph.scala:116)
                at org.apache.spark.streaming.scheduler.JobGenerator$$anonfun$3.apply(JobGenerator.scala:249)
                at org.apache.spark.streaming.scheduler.JobGenerator$$anonfun$3.apply(JobGenerator.scala:247)
                at scala.util.Try$.apply(Try.scala:192)
                at org.apache.spark.streaming.scheduler.JobGenerator.generateJobs(JobGenerator.scala:247)
                at org.apache.spark.streaming.scheduler.JobGenerator.org$apache$spark$streaming$scheduler$JobGenerator$$processEvent(JobGenerator.scala:183)
                at org.apache.spark.streaming.scheduler.JobGenerator$$anon$1.onReceive(JobGenerator.scala:89)
                at org.apache.spark.streaming.scheduler.JobGenerator$$anon$1.onReceive(JobGenerator.scala:88)
                at org.apache.spark.util.EventLoop$$anon$1.run(EventLoop.scala:48)
            18/03/20 10:44:00 ERROR ApplicationMaster: User class threw exception: java.lang.IllegalStateException: No current assignment for partition

我的发现-

1- 帖子中的类似问题 - Kafka Spark Stream throws Exception:No current assignment for partition这并没有对为什么使用 Assign 而不是 Subscribe 给出太多解释。

2- 为了确保没有重新平衡，我将 session.timeout.ms 增加到几乎我的批处理持续时间，因为我的处理在不到 2 分钟(批处理持续时间)内完成。

session.timeout.ms-消费者在仍被视为活着的情况下可以与经纪人失去联系的时间( https://www.safaribooksonline.com/library/view/kafka-the-definitive/9781491936153/ch04.html )

3- 遇到 Re-balance Listeners with 方法 -一个 onPartitionsRevokedb onPartitionsAssigned

但我无法理解如何使用第一个在重新平衡之前提交偏移量的。

任何输入将不胜感激。

最佳答案

我遇到过同样的问题。当我的两个 spark 作业使用相同的 kafka client.id 时。所以我已经为另一个作业分配了新的 kafka 客户端

关于apache-spark - 为 kafka 主题 : No current assignment for partition topic1 分配新分区(旧分区被撤销)后，Spark Streaming 作业失败，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/49452967/

文章推荐： Angular 5 - 添加标题时的问题

文章推荐： Emacs ediff-buffers 复制 *all* 从 a 到 b 的差异(反之亦然)

文章推荐： datalog - Datalog 中是否可以查询不存在？

nginx - 旧 SSL 证书在续订后仍在使用
几周前，我安装了一个新的 ssl 证书来替换一个过期的证书。 .crt 和 .key 的文件名保持不变。只是内容变了。现在，当我访问我的网站时，它说证书已过期，我看到它正在使用旧的证书链。我可以确认
php - 旧 PHP 版本中的类命名空间
这个问题在这里已经有了答案: Make namespaces backwards compatible in PHP (4 个回答) 8 年前关闭。我真的很想在我的工作流程中采用命名空间。据我了解，
codenameone - 旧 GUI 中的主题问题
我从 CN1 开始，然后以 Todo App 为例。当我在 Netbeans 中运行 de app 时，只出现一个空白表单，我更改了主题，添加了一个 jpg 图像并使用旧的 GUI Builder 在
Laravel 4 - 单选按钮的输入::旧
我想知道是否有一些 Laravel 人员可以帮忙。我有一个表单，其中有 2 个单选按钮，当表单提交时，它会通过验证器，如果验证器失败，它会返回表单，使用输入填充字段并显示错误消息。我似乎无法对单选
java - 旧 Java 代码中的异常
我正在使用 Java 中没有泛型的旧代码。 hashMap 是在该代码中定义的，没有泛型，例如: Map A = new HashMap(); 在这段代码中，我想如何确定要在键和值中放入什么内容，以及
java - 旧 Java 项目兼容性
我想问一个关于项目兼容性的问题。我的论文项目是在Windows Vista和XP上在JRE 1.6和JDK 1.6下开发的。该项目使用Java新套接字。今天我尝试在 Windows 8(64 位)机器
python - 旧 Plone 产品的自动化蛋化
有谁知道一个脚本可以将旧的 Products 命名空间样式 Plone 附加组件包装到 Egg 中吗？生成setup.py 创建目录结构还需要采取其他措施吗？鸡蛋化过程中有什么陷阱吗？最佳答案
mysql - 旧数据，旧 MySQL
我已经运行 MySQL 5.6.12 一段时间了。我决定将我的 WAMP 服务器更新到最新的 PHP 版本。在此过程中，它还将 MySQL 更新到 5.6.17，保留 .12 数据，但无法访问。如
mysql - 旧 MySQL 代码出现空格错误
最近，我一直在尝试根据互联网上的各种旧教程编写论坛代码，但是我最近遇到了一个问题 - 尽管我完全按照教程所述进行操作，但我收到了空格错误。我认为这可能是因为某些 MySQL 命令可能已更改。如果有人可
php - 旧 MySQL 中的错误查询
我正在创建对 Count 表的查询。 $Month = $_POST['Month']; $query = "SELECT ANY_VALUE(AD) AS ad, COU
旧 mysql 版本的 mysqldump
如果我使用 mysqldump 工具备份旧版本的 MySql 数据库，是否存在任何已知风险？例如，如果我在生产机器上使用 mysqldump 5.6 来备份 MySql 5.X 数据库。最佳答案有
javascript - 旧 JSON 值已更改
当将 columnsData 值分配给 columns 时，我有两个 JSON 对象 columnsData 和 columns，这两个值都会更改。 var columnsData = [
c++ - 旧 C++ 编译器中的防护
我有一个需要在 gcc 4.4 上编译的多线程应用程序，我不允许使用 c++0x 标志。我希望一个变量以原子方式运行，但不幸的是没有 C++0x 标志我无法使用 atomic在 C++ 中。我试过
android - 更改时间后获取上一个(旧)时间
我可以借助广播事件(ACTION_TIME_CHANGED 和 ACTION_DATE_CHANGED)获取时间更改事件。我需要在时间更改后获取之前的时间。例如，当前时间是 10:00。我要把时间改
Android - DatePickerDialog - 旧 API
我正在尝试在我的 Android 应用程序中创建一个 DatePickerDialog，但是当我创建一个 DatePickerDialog 时，我收到以下消息:Call requires API le
php - Laravel 旧()不工作
{!! Form::open(array('route' => 'posts.store', 'data-parsley-validate' => '')) !!} {{ Form::labe
ios - 旧 iOS 设备的蓝牙框架
我的问题与 iOS 周围的蓝牙技术有关。我看过关于蓝牙低功耗 101、新功能、基础知识等的 WWDC，以及关于使用 iOS 5 及更高版本中可用的 CoreBluetooth 框架的内容。我浏览了不同
ios - 旧 View 的线程仍在运行
我有一个有五个屏幕的应用。在每个屏幕上，我在 viewDidLoad 中从服务器访问数据。在每个屏幕上我都有下一个按钮。当我从屏幕一转到屏幕五(通过单击下一步 4 次)时，在 NSLog 中，我
php - 旧 Symfony 应用程序的问题
我最近在一家网络报纸找到了一份工作。在网站上，我们有一个非常古老且重要的 Symfony 应用程序，它是为一位年长的开发人员编写的，已经消失很久了。该应用程序是神圣的:是报纸收入的血液。问题是我们没有
旧 "struct hack"(?) 的符合变体
我相信我已经找到了一种方法来实现类似可移植 C89 中众所周知的“struct hack”的方法。我很好奇这是否真的严格符合 C89。主要思想是:我分配足够大的内存来容纳初始结构和数组元素。确切的大

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

apache-spark - 为 kafka 主题 : No current assignment for partition topic1 分配新分区(旧分区被撤销)后，Spark Streaming 作业失败