multithreading - 故障超过阈值时停止所有异步任务？-6ren

multithreading - 故障超过阈值时停止所有异步任务？

转载作者：行者123 更新时间：2023-12-02 02:39:58

25

4

我正在使用 Monix Task 用于异步控制。

场景

任务并行执行
如果失败超过X次
停止所有尚未完成状态的任务(越快越好)

我的解决方案

我提出了在 1.result 和 2.error counter 之间竞赛的想法，并取消失败者。
通过 Task.race 如果错误计数器首先达到阈值，则任务将被 Task.race 取消。

实验

关于 Ammonite回复

{
  import $ivy.`io.monix::monix:3.1.0`
  import monix.eval.Task
  import monix.execution.atomic.Atomic
  import scala.concurrent.duration._
  import monix.execution.Scheduler
  //import monix.execution.Scheduler.Implicits.global
  implicit val s = Scheduler.fixedPool("race", 2) // pool size

  val taskSize = 100
  val errCounter = Atomic(0)
  val threshold = 3

  val tasks = (1 to taskSize).map(_ => Task.sleep(100.millis).map(_ => errCounter.increment()))
  val guard = Task(f"stop because too many error: ${errCounter.get()}")
    .restartUntil(_ => errCounter.get() >= threshold)

  val race = Task
    .race(guard, Task.gather(tasks))
    .runToFuture
    .onComplete { case x => println(x); println(f"completed task: ${errCounter.get()}") }
}

问题

结果取决于线程池大小!？

对于池大小 1
结果几乎总是任务成功，即没有停止。

Success(Right(.........))
completed task: 100 // all task success !

对于池大小 2
成功与失败之间非常不确定，取消也不准确。例如:

Success(Left(stop because too many error: 1))
completed task: 98

最迟在完成 98 个任务后才取消。
错误计数小到阈值很奇怪。

默认的全局调度器得到同样的结果行为。

池大小为 200
它更具确定性，停止更早，因此在完成更少任务的意义上更准确。

Success(Left(stop because too many error: 2))
completed task: 8

池大小越大越好。

如果我将 Task.gather 更改为 Task.sequence 执行，所有问题都消失了!

这种对池大小的依赖性的原因是什么？一旦发生太多错误，如何改进它或是否有更好的方法来停止任务？

最佳答案

您所看到的很可能是 monix 调度程序的影响以及它如何实现公平性。这是一个相当复杂的主题，但文档和 scaladocs 非常好(参见:https://monix.io/docs/3x/execution/scheduler.html#execution-model)

当您只有一个(或几个)线程时，“守卫”任务需要一段时间才能进行另一轮检查。使用 Task.gather，您可以同时启动 100 个任务，因此调度程序非常繁忙，“守卫”无法再次检查，直到其他任务已经完成。如果每个任务只有一个线程，则调度程序无法保证公平性，因此“守卫”不公平地检查得更频繁并且可以更快完成。

如果您使用 Task.sequence，那 100 个任务将按顺序执行，这就是为什么“守卫”任务有更多机会在需要时尽快完成的原因。如果你想让你的代码保持原样，你可以使用 Task.gatherN(parallelism = 4) 这将限制并行度，因此允许你的“守卫”更频繁地检查(介于两者之间的中间地带) Task.sequence 和 Task.gather)。

在我看来它有点像 Go 代码(使用 Task.race 就像 Go 的 select)而且你还使用了不受约束的副作用，这进一步复杂化了理解什么是继续。我试图以一种更惯用的方式重写您的程序，对于复杂的并发性，我通常会使用 Observable 之类的流:

import cats.effect.concurrent.Ref
import monix.eval.Task
import monix.execution.Scheduler
import monix.reactive.Observable

import scala.concurrent.duration._

object ErrorThresholdDemo extends App {

  //import monix.execution.Scheduler.Implicits.global
  implicit val s: Scheduler = Scheduler.fixedPool("race", 2) // pool size

  val taskSize  = 100
  val threshold = 30

  val program = for {
    errCounter <- Ref[Task].of(0)

    tasks = (1 to taskSize).map(n => Task.sleep(100.millis).flatMap(_ => errCounter.update(_ + (n % 2))))

    tasksFinishedCount <- Observable
      .fromIterable(tasks)
      .mapParallelUnordered(parallelism = 4) { task =>
        task
      }
      .takeUntilEval(errCounter.get.restartUntil(_ >= threshold))
      .map(_ => 1)
      .sumL

    errorCount <- errCounter.get
    _          <- Task(println(f"completed tasks: $tasksFinishedCount, errors: $errorCount"))
  } yield ()

  program.runSyncUnsafe()
}

如您所见，我不再使用全局可变副作用，而是使用 Ref，它内部也使用 Atomic，但提供了一个函数式 api，我们可以将其与 任务。出于演示目的，我还将阈值更改为 30，只有其他所有任务都会“出错”。因此无论线程池大小如何，预期的输出始终在 completed tasks: 60, errors: 30 左右。

我仍在使用 errCounter.get.restartUntil(_ >= threshold) 进行轮询，根据我的口味，这可能会消耗过多的 CPU，但它接近您最初的想法并且运行良好。

通常我不会预先创建任务列表，而是将输入放入 Observable 并在 .mapParallelUnordered 中创建任务。此代码保留您的列表，这就是为什么不涉及真正的映射(它已经包含任务)。

您可以选择所需的并行度，就像使用 Task.gatherN 一样，我觉得这非常好。

如果还有什么不清楚的，请告诉我:)

关于multithreading - 故障超过阈值时停止所有异步任务？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/60245188/

25

4

0

文章推荐： sdk - 交互式多点触控应用框架推荐

文章推荐： list - 用语义上等效的猫功能替换 scalaz ListT

android - 当我们使用 SQLite 时，当我们使用 content provider 时，当我们使用 Shared preference 时
SQLite、Content provider 和 Shared Preference 之间的所有已知区别。但我想知道什么时候需要根据情况使用 SQLite 或 Content Provider 或
Backbone.js 模型验证仅在 set->save 时(不是在 fetch 时)
警告:我正在使用一个我无法完全控制的后端，所以我正在努力解决 Backbone 中的一些注意事项，这些注意事项可能在其他地方更好地解决......不幸的是，我别无选择，只能在这里处理它们! 所以，我的
jquery - 使用 “prefetch” 时 Twitter 预输入没有结果，但使用 “remote” JSON 时
我一整天都在挣扎。我的预输入搜索表达式与远程 json 数据完美配合。但是当我尝试使用相同的 json 数据作为预取数据时，建议为空。点击第一个标志后，我收到预定义消息“无法找到任何内容...”，结果
java - repaint() 时 JTextArea 不显示，但 revalidate() 时 Graphics 不更新？
我正在制作一个模拟 NHL 选秀彩票的程序，其中屏幕右侧应该有一个 JTextField，并且在左侧绘制弹跳的选秀球。我创建了一个名为 Ball 的类，它实现了 Runnable，并在我的主 Draf
java - java中将时间戳转换为特定格式(年、月、周、日、时、时、分、秒)
这个问题已经有答案了: How can I calculate a time span in Java and format the output? (18 个回答) 已关闭 9 年前。这是我的代码
设置 header 时 AJAX 请求失败，但没有设置 header 时 AJAX 请求会成功
我有一个 ASP.NET Web API 应用程序在我的本地 IIS 实例上运行。 Web 应用程序配置有 CORS。我调用的 Web API 方法类似于: [POST("/API/{foo}/{ba
android - 用户输入年、月、日、时、分与系统年、月、日、时、分的区别
我将用户输入的时间和日期作为: DatePicker dp = (DatePicker) findViewById(R.id.datePicker); TimePicker tp = (TimePic
algorithm - 在处理 Tabu Search Optimization 时，当所有相邻解决方案都是 tabu 时，通常的做法是什么？
放宽“邻居”的标准是否足够，或者是否有其他标准行动可以采取？最佳答案如果所有相邻解决方案都是 Tabu，则听起来您的 Tabu 列表的大小太长或您的释放策略太严格。一个好的 Tabu 列表长度是
c++ - 为什么我需要传递一个比较器来构造一个 priority_queue，当它是 lambda 时，而不是当它是 std::greater 时？
我正在阅读来自 cppreference 的代码示例: #include #include #include #include template void print_queue(T& q)
javascript - 当触发器为 'click' 时，Bootstrap 3 工具提示表现得很奇怪，当触发器为 'manual' 时，则不起作用
我快疯了，我试图理解工具提示的行为，但没有成功。 1. 第一个问题是当我尝试通过插件(按钮 1)在点击事件中使用它时 -> 如果您转到 Fiddle，您会在“内容”内看到该函数' 每次点击都会调用该属
javascript - 使用 useContext 时，数据首先加载为空数组，当我应用 .map() 或 .find() 时，我收到一条错误消息
我在功能组件中有以下代码: const [ folder, setFolder ] = useState([]); const folderData = useContext(FolderContex
swift - 使用 NSURLSession 时 GET 成功，但使用 AFHTTPSessionManager 时 GET 失败
我在使用预签名网址和 AFNetworking 3.0 从 S3 获取图像时遇到问题。我可以使用 NSMutableURLRequest 和 NSURLSession 获取图像，但是当我使用 AFHT
java - 当池生命周期为 LIFE_CYCLE_FAILED 时，使用 UCP 管理器调用 closeConnections() 时 UCP 连接是否关闭？
我正在使用 Oracle ojdbc 12 和 Java 8 处理 Oracle UCP 管理器的问题。当 UCP 池启动失败时，我希望关闭它创建的连接。当池初始化期间遇到 ORA-02391:超过
ios - 当我点击 "Run"时，应用程序崩溃，但是当我点击 "Stop"然后 "Run"时，应用程序崩溃
关闭。此题需要details or clarity 。目前不接受答案。想要改进这个问题吗？通过 editing this post 添加详细信息并澄清问题. 已关闭 9 年前。 Improve
css - 我有一个笨蛋。当我在全局范围内定义我的 css 时，它起作用了。当我在我的组件中定义我的 css 时，它失败了。这是怎么回事？
引用这个plunker: https://plnkr.co/edit/GWsbdDWVvBYNMqyxzlLY?p=preview 我在 styles.css 文件和 src/app.ts 文件中指定
python - 当宽度 <1.0 时，Matplotlib 周线太细；当宽度>=1.0 时，周线太粗
为什么我的条形这么细？我尝试将宽度设置为 1，它们变得非常厚。我不知道还能尝试什么。默认厚度为 0.8，这是应该的样子吗？ import matplotlib.pyplot as plt import
当我使用 RIGHT JOIN 时，MYSQL 无法识别字段，但当我使用 NATURAL JOIN 时，MYSQL 可以识别字段
当我编写时，查询按预期执行: SELECT id, day2.count - day1.count AS diff FROM day1 NATURAL JOIN day2; 但我真正想要的是右连接。当
python - 在 pandas 中读取时间值(时、分、秒、日、月、年)时，如何指定先到先得？
我有以下时间数据: 0 08/01/16 13:07:46,335437 1 18/02/16 08:40:40,565575 2 14/01/16 22:2
javascript - 当我使用 axios POST 时，Req.body 为空，但当我使用 'request' 时，它工作正常
一些背景知识 -我的 NodeJS 服务器在端口 3001 上运行，我的 React 应用程序在端口 3000 上运行。我在 React 应用程序 package.json 中设置了一个代理来代理对端
javascript - 使用 AngularJs 时，当 img 标签具有 src attr 时，如何在其上设置 data-src
我面临着一个愚蠢的问题。我试图在我的 Angular 应用程序中延迟加载我的图像，我已经尝试过这个2: 但是他们都设置了 src attr 而不是 data-src，我在这里遗漏了什么吗？保留 d

首页

博学

6Ren·AI

商城

multithreading - 故障超过阈值时停止所有异步任务？

场景

我的解决方案

实验

问题