- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在使用 Monix Task
用于异步控制。
我提出了在 1.result 和 2.error counter 之间竞赛的想法,并取消失败者。
通过 Task.race
如果错误计数器首先达到阈值,则任务将被 Task.race
取消。
关于 Ammonite回复
{
import $ivy.`io.monix::monix:3.1.0`
import monix.eval.Task
import monix.execution.atomic.Atomic
import scala.concurrent.duration._
import monix.execution.Scheduler
//import monix.execution.Scheduler.Implicits.global
implicit val s = Scheduler.fixedPool("race", 2) // pool size
val taskSize = 100
val errCounter = Atomic(0)
val threshold = 3
val tasks = (1 to taskSize).map(_ => Task.sleep(100.millis).map(_ => errCounter.increment()))
val guard = Task(f"stop because too many error: ${errCounter.get()}")
.restartUntil(_ => errCounter.get() >= threshold)
val race = Task
.race(guard, Task.gather(tasks))
.runToFuture
.onComplete { case x => println(x); println(f"completed task: ${errCounter.get()}") }
}
结果取决于线程池大小!?
对于池大小 1
结果几乎总是任务成功,即没有停止。
Success(Right(.........))
completed task: 100 // all task success !
对于池大小 2
成功与失败之间非常不确定,取消也不准确。例如:
Success(Left(stop because too many error: 1))
completed task: 98
最迟在完成 98 个任务后才取消。
错误计数小到阈值很奇怪。
默认的全局调度器得到同样的结果行为。
池大小为 200
它更具确定性,停止更早,因此在完成更少任务的意义上更准确。
Success(Left(stop because too many error: 2))
completed task: 8
池大小越大越好。
如果我将 Task.gather
更改为 Task.sequence
执行,所有问题都消失了!
这种对池大小的依赖性的原因是什么?一旦发生太多错误,如何改进它或是否有更好的方法来停止任务?
最佳答案
您所看到的很可能是 monix 调度程序的影响以及它如何实现公平性。这是一个相当复杂的主题,但文档和 scaladocs 非常好(参见:https://monix.io/docs/3x/execution/scheduler.html#execution-model)
当您只有一个(或几个)线程时,“守卫”任务需要一段时间才能进行另一轮检查。使用 Task.gather
,您可以同时启动 100 个任务,因此调度程序非常繁忙,“守卫”无法再次检查,直到其他任务已经完成。如果每个任务只有一个线程,则调度程序无法保证公平性,因此“守卫”不公平地检查得更频繁并且可以更快完成。
如果您使用 Task.sequence
,那 100 个任务将按顺序执行,这就是为什么“守卫”任务有更多机会在需要时尽快完成的原因。如果你想让你的代码保持原样,你可以使用 Task.gatherN(parallelism = 4)
这将限制并行度,因此允许你的“守卫”更频繁地检查(介于两者之间的中间地带) Task.sequence
和 Task.gather
)。
在我看来它有点像 Go 代码(使用 Task.race
就像 Go 的 select
)而且你还使用了不受约束的副作用,这进一步复杂化了理解什么是继续。我试图以一种更惯用的方式重写您的程序,对于复杂的并发性,我通常会使用 Observable
之类的流:
import cats.effect.concurrent.Ref
import monix.eval.Task
import monix.execution.Scheduler
import monix.reactive.Observable
import scala.concurrent.duration._
object ErrorThresholdDemo extends App {
//import monix.execution.Scheduler.Implicits.global
implicit val s: Scheduler = Scheduler.fixedPool("race", 2) // pool size
val taskSize = 100
val threshold = 30
val program = for {
errCounter <- Ref[Task].of(0)
tasks = (1 to taskSize).map(n => Task.sleep(100.millis).flatMap(_ => errCounter.update(_ + (n % 2))))
tasksFinishedCount <- Observable
.fromIterable(tasks)
.mapParallelUnordered(parallelism = 4) { task =>
task
}
.takeUntilEval(errCounter.get.restartUntil(_ >= threshold))
.map(_ => 1)
.sumL
errorCount <- errCounter.get
_ <- Task(println(f"completed tasks: $tasksFinishedCount, errors: $errorCount"))
} yield ()
program.runSyncUnsafe()
}
如您所见,我不再使用全局可变副作用,而是使用 Ref
,它内部也使用 Atomic
,但提供了一个函数式 api,我们可以将其与 任务
。出于演示目的,我还将阈值更改为 30,只有其他所有任务都会“出错”。因此无论线程池大小如何,预期的输出始终在 completed tasks: 60, errors: 30
左右。
我仍在使用 errCounter.get.restartUntil(_ >= threshold)
进行轮询,根据我的口味,这可能会消耗过多的 CPU,但它接近您最初的想法并且运行良好。
通常我不会预先创建任务列表,而是将输入放入 Observable 并在 .mapParallelUnordered
中创建任务。此代码保留您的列表,这就是为什么不涉及真正的映射(它已经包含任务)。
您可以选择所需的并行度,就像使用 Task.gatherN
一样,我觉得这非常好。
如果还有什么不清楚的,请告诉我:)
关于multithreading - 故障超过阈值时停止所有异步任务?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60245188/
Task.WaitAll 方法等待所有任务,Task.WaitAny 方法等待一个任务。如何等待任意N个任务? 用例:下载搜索结果页面,每个结果都需要一个单独的任务来下载和处理。如果我使用 WaitA
我正在查看一些像这样的遗留 C# 代码: await Task.Run(() => { _logger.LogException(LogLevel.Error, mes
如何在 Linux 中运行 cron 任务? 关注此Q&A ,我有这个 cron 任务要运行 - 只是将一些信息写入 txt 文件, // /var/www/cron.php $myfile = fo
原谅我的新手问题,但我想按顺序执行三个任务并在剧本中使用两个角色: 任务 角色 任务 角色 任务 这是我到目前为止(任务,角色,任务): --- - name: Task Role Task ho
我有一个依赖于 installDist 的自定义任务 - 不仅用于执行,还依赖于 installDist 输出: project.task('run', type: JavaExec, depends
从使用 Wix 创建的 MSI 运行卸载时,我需要在尝试删除任何文件之前强行终止在后台运行的进程。主要应用程序由一个托盘图标组成,它反射(reflect)了 bg 进程监控本地 Windows 服务的
我想编写 Ant 任务来自动执行启动服务器的任务,然后使用我的应用程序的 URL 打开 Internet Explorer。 显然我必须执行 startServer先任务,然后 startApplic
使用 ASP.NET 4.5,我正在尝试使用新的 async/await 玩具。我有一个 IDataReader 实现类,它包装了一个特定于供应商的阅读器(如 SqlDatareader)。我有一个简
使用命令 gradle tasks可以得到一份所有可用任务的报告。有什么方法可以向此命令添加参数并按任务组过滤任务。 我想发出类似 gradle tasks group:Demo 的命令筛选所有任务并
除了sshexec,还有什么办法吗?任务要做到这一点?我知道您可以使用 scp 复制文件任务。但是,我需要执行其他操作,例如检查是否存在某些文件夹,然后将其删除。我想使用类似 condition 的东
假设我有字符串 - "D:\ApEx_Schema\Functions\new.sql@@\main\ONEVIEW_Integration\3" 我需要将以下内容提取到 diff 变量中 - 文档名
我需要编写一个 ant 任务来确定某个文件是否是只读的,如果是,则失败。我想避免使用自定义选择器来为我们的构建系统的性质做这件事。任何人都有任何想法如何去做?我正在使用 ant 1.8 + ant-c
这是一个相当普遍的计算机科学问题,并不特定于任何操作系统或框架。 因此,我对与在线程池上切换任务相关的开销感到有些困惑。在许多情况下,给每个作业分配自己的特定线程是没有意义的(我们不想创建太多硬件线程
我正在使用以下 Ansible playbook 一次性关闭远程 Ubuntu 主机列表: - hosts: my_hosts become: yes remote_user: my_user
如何更改 Ant 中的当前工作目录? Ant documentation没有 任务,在我看来,最好的做法是不要更改当前工作目录。 但让我们假设我们仍然想这样做——你会如何做到这一点?谢谢! 最佳答案
是否可以运行 cronjob每三天一次?或者也许每月 10 次。 最佳答案 每三天运行一次 - 或更短时间在月底运行一次。 (如果上个月有 31 天,它将连续运行 2 天。) 0 0 */3 * *
如何在 Gradle 任务中执行托管在存储库中的工具? 在我的具体情况下,我正在使用 Gradle 构建一个 Android 应用程序。我添加了一项任务,将一些 protobuf 数据从文本编码为二进
我的项目有下一个结构: Root |- A |- C (depends on A) \- B (depends on A) 对于所有子项目,我们使用自己的插件生成资源:https://githu
我设置了一个具有4个节点的Hadoop群集,其中一个充当HDFS的NameNode以及Yarn主节点。该节点也是最强大的。 现在,我分发了2个文本文件,一个在node01(名称节点)上,一个在node
在 TFS 2010 中为多个用户存储任务的最佳方式是什么?我只能为一项任务分配一个。 (例如:当我计划向所有开发人员演示时) (这是一个 Scrum Msf 敏捷项目,其中任务是用户故事的一部分)
我是一名优秀的程序员,十分优秀!