apache-spark - StreamingQuery.awaitTermination 的目的是什么？-6ren

apache-spark - StreamingQuery.awaitTermination 的目的是什么？

转载作者：行者123 更新时间：2023-12-03 23:21:32

26

4

我有一个 Spark Structured Streaming 作业，它从 Kafka 主题读取偏移量并将其写入 aerospike 数据库。目前，我正在准备此作业生产并实现 SparkListener .

在阅读文档时，我偶然发现了这个例子:

StreamingQuery query = wordCounts.writeStream()
    .outputMode("complete")
    .format("console")
    .start();
query.awaitTermination();
After this code is executed, the streaming computation will have
started in the background. The query object is a handle to that active
streaming query, and we have decided to wait for the termination of
the query using awaitTermination() to prevent the process from exiting
while the query is active.

我知道它在终止进程之前等待查询完成。

这究竟是什么意思？它有助于避免查询写入的数据丢失。

当查询每天写入数百万条记录时，它有什么帮助？

我的代码看起来很简单:

dataset.writeStream()
  .option("startingOffsets", "earliest")
  .outputMode(OutputMode.Append())
  .format("console")
  .foreach(sink)
  .trigger(Trigger.ProcessingTime(triggerInterval))
  .option("checkpointLocation", checkpointLocation)
  .start();

最佳答案

这里有很多问题，但只回答下面的一个就可以回答所有问题。

I understand that it waits for query to complete before terminating the process. What does it mean exactly?

流查询在单独的守护线程中运行。在 Java 中，守护线程用于允许并行处理，直到 Spark 应用程序的主线程完成(死亡)。在最后一个非守护线程完成后，JVM 关闭，整个 Spark 应用程序完成。

这就是为什么您需要让主非守护线程等待其他守护线程，以便它们可以完成它们的工作。

阅读 What is a daemon thread in Java? 中的守护进程线程

关于apache-spark - StreamingQuery.awaitTermination 的目的是什么？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/53524198/

26

4

0

文章推荐： bash - 如何将 wslpath/home/user/转换为 windows 路径

文章推荐： c# - 在 View 上自动更新 ViewComponent

文章推荐： ag-grid-angular:错误类型错误:rowData.forEach 不是函数

java - ExecutorService.awaitTermination() 永远不会超时
我正在尝试实现一个函数，其中可调用对象在规定时间内完成或操作超时。我曾希望 ExecutorService.awaitTermination() 能够执行此操作，但惊讶地发现它没有执行此操作。代码如下
java - 线程加入与 ExecutorService.awaitTermination
我有一组线程，它们都需要并行执行，并且我必须等待所有线程完成。我应该使用普通的旧Thread还是ExecutorService？对于 ExecutorService.awaitTermination
java - awaitTermination 函数出现 IllegalMonitorStateException
我在 Java 中使用线程时遇到问题(我在 Java 中使用线程的经验很少，但在 C++ 中使用很多，所以我了解线程的基本概念)。我已经在 Java 中使用了线程的示例代码，接下来是代码:
java - .awaitTermination() 是否在执行程序中完成工作之前建立 happens-before？
我多年来一直存在的问题:在此伪代码中， ExecutorService svc = Executors.newFixedThreadPool(3); svc.submit(new Runnable()
java - ExecutorService awaitTermination 方法未按预期执行
我正在尝试用 Java 编写一个流程，它同时执行一系列任务，等待任务完成，然后将整个流程标记为已完成。每个任务都有自己的信息，包括单个任务何时完成。我正在为流程使用 ExecutorService，并
java - ExecutorService awaitTermination 卡住了
我用 Executors.newFixedThreadPool(2) 创建了一个固定大小的线程池，并执行了 10 个 Runnable 对象。我设置断点并跟踪执行。但是，即使所有任务都已完成，fixe
apache-spark - StreamingQuery.awaitTermination 的目的是什么？
我有一个 Spark Structured Streaming 作业，它从 Kafka 主题读取偏移量并将其写入 aerospike 数据库。目前，我正在准备此作业生产并实现 SparkListene
java - shutdown() 之后需要 ExecutorService.awaitTermination()
根据 Javadocs，shutdown()将等待所有提交任务执行。我有两个问题: 提交的任务是什么意思？任务是否必须通过 ExecutorService.submit() 方法专门提交，或者也包括通
Java执行器服务: awaitTermination of all recursively created tasks
我使用 ExecutorService 来执行任务。此任务可以递归地创建提交给同一个 ExecutorService 的其他任务，并且这些子任务也可以执行此操作。我现在遇到的问题是我想等到所有任务都
java - ExecutorService:awaitTermination VS while 循环
我必须等待 executorService 中的所有线程完成。我应该使用 while(!executor.isTerminated()){...} or executor.awaitTerminati
java - 了解 java 执行程序服务关闭和 awaitTermination
需要澄清以下行为。我有一个带有 java.util.concurrent.ExecutorService 的 java 应用程序，如下所示， for (int i = 0; i < t
java - 为什么 ExecutorService.awaitTermination() 在提交的任务完成之前成功
在我的代码中，我有许多作为管道运行的 executorservices，因为第一个 executorService 可以将任务提交给任何后续的 executor 服务，但绝不会反过来。 servi
Java ExecutorService - 如果 awaitTermination() 失败怎么办？
如果我有以下代码，它工作正常: ExecutorService service = Executors.newFixedThreadPool(100); [....] List> futures =
java - shutdown 和 awaitTermination 哪个第一次调用有什么区别？
有什么区别 ExecutorService eService = Executors.newFixedThreadPool(2); eService.execute(new TestThread6()
java - 为什么没有 "awaitTermination(Date deadline)"方法？
我有一个提交给 ExecutorService 的任务列表。 .但是我需要在凌晨 2:30 的最后期限之前关闭 ExecutorService，即使任务没有完成。我怎样才能做到这一点？我检查了API，
java - ExecutorService.awaitTermination(timeout,unit) 即使超时后仍继续运行
我有两个类。一个 POJO 和 main。 POJO类 public class Processor implements Runnable{ private int id; public Proce
java - 使用 CompletionService 时强制执行 executorService.awaitTermination
我正在尝试提交多个任务并在可用时获取结果。但是，循环结束后，我必须强制所有任务在指定的时间内完成。如果没有，则抛出错误。最初，我所拥有的只是 executorService 的 invokeAll、s
java - 我们需要在 ScheduledExecutorService 上调用 awaitTermination 吗？
我是 Java 多线程的新手。我有数以千计的计划任务/线程需要执行。我正在使用以下代码: ScheduledExecutorSerivce scheduleService = Executors.ne
java - ExecutorService "happens-before"中的 awaitTermination 是否在其后执行任何代码？
请帮助理解 ExecutorService#awaitTermination(timeout) 行为。我正在观察我的代码中的情况: private void shutdownAndAwaitTerm
Java ExecutorService : awaitTermination of all recursively created tasks
我使用 ExecutorService 来执行任务。该任务可以递归地创建提交给同一ExecutorService的其他任务，这些子任务也可以这样做。我现在有一个问题，我想等到所有任务都完成(即所有任

首页

博学

6Ren·AI

商城

apache-spark - StreamingQuery.awaitTermination 的目的是什么？