multithreading - Go 中的简单工作池-6ren

multithreading - Go 中的简单工作池

转载作者：IT王子更新时间：2023-10-29 01:38:57

26

4

我正在尝试在 go 中实现一个简单的工作线程池，但一直遇到问题。我只想让一定数量的 worker 完成一定数量的工作，然后再做更多的工作。我使用的代码类似于:

    jobs := make(chan imageMessage, 1)
    results := make(chan imageMessage, 1)

    for w := 0; w < 2; w++ {
        go worker(jobs, results)
    }

    for j := 0; j < len(images); j++ {
        jobs <- imageMessage{path: paths[j], img: images[j]}
    }
    close(jobs)

    for r := 0; r < len(images); r++ {
        <-results
    }
}

func worker(jobs <-chan imageMessage, results chan<- imageMessage) {
    for j := range jobs {
        processImage(j.path, j.img)
        results <- j
    }
}

我的理解是，这应该创建 2 个 worker ，他们可以一次做 1 件“事情”，并且在他们完成那 1 件事情时会继续获得更多工作，直到没有其他事情可做。但是，我得到了 fatal error: all goroutines are sleep - deadlock!

如果我将缓冲区设置为 100 之类的大值，这会起作用，但我希望能够限制一次完成的工作。

我觉得我很接近，但显然遗漏了一些东西。

最佳答案

问题在于，一旦您成功发送了jobs channel 上的所有作业，您就只会开始“耗尽”results channel 。但是为了能够发送所有作业，jobs channel 必须有足够大的缓冲区，或者 worker goroutines 必须能够从中使用作业。

但是一个 worker goroutines 在消费一个工作时，在它可以接受下一个工作之前，将结果发送到 results channel 。如果 results channel 的缓冲区已满，将阻塞发送结果。

但是最后一部分——在发送结果时被阻塞的工作协程——只能通过从 results channel 接收来“解除阻塞”——直到你可以发送所有的作业。如果 jobs channel 和 results channel 的缓冲区不能容纳您的所有作业，则会出现死锁。这也解释了为什么如果将缓冲区大小增加到一个大值它会起作用:如果作业可以放入缓冲区，则不会发生死锁，并且在成功发送所有作业后，您的最终循环将耗尽 results channel 。

解决方案？在自己的 goroutine 中运行生成和发送作业，因此您可以“立即”开始从 results channel 接收数据，而不必等待发送所有作业，这意味着 worker goroutines 不会永远被阻塞尝试发送结果:

go func() {
    for j := 0; j < len(images); j++ {
        jobs <- imageMessage{path: paths[j], img: images[j]}
    }
    close(jobs)
}()

在 Go Playground 上试试.

另请查看 Is this an idiomatic worker thread pool in Go? 中的类似实现

关于multithreading - Go 中的简单工作池，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/40405132/

26

4

0

文章推荐： go - 在结构体中初始化结构体

文章推荐： xml - Groovy XML MarkupBuilder 不创建根

文章推荐： xml - Delphi 中 XML 的库和教程

文章推荐： go - 如何在 Go 的单独函数中正确使用这些变量？

azure - 为什么我可以连接到 Synapse 无服务器 SQL 池，但无法连接到同一 Synapse 工作区中的专用 SQL 池
最近，我们将专用 SQL 池部署到生产中的 Synapse 工作区。在开发中，我们可以访问无服务器 SQL 池和专用 SQL 池。但是，在生产中，我们可以访问无服务器 SQL 池，但无法访问专用 SQ
WCF 客户端连接缓存/池
假设您从一个项目公开 WCF 服务，并使用“添加服务引用”(在本例中为 Framework 3.5 WPF 应用程序)在另一个项目中使用它。当您重新实例化 ClientBase 派生代理时，Clie
Python 池生成池
我有一个函数，它使用 multiprocessing.Pool 并行处理一个数据集中的所有数据。 from multiprocessing import Pool ... def func():
带有工作进程的 python 池
我正在尝试使用进程对象在 python 中使用工作池。每个 worker (一个进程)进行一些初始化(花费大量时间)，传递一系列作业(理想情况下使用 map())，并返回一些东西。除此之外，不需要任何
ZFS 列表与 ZFS 池
我是软件工程师，最近我构建了我的 Linux 机器，想探索更多系统管理员类型的任务。我已经探索并阅读了很多关于 ZFS 的内容，但我越来越困惑，因为每篇文章对它的描述都不一样。 Everything
zfs - 如何在池繁忙时销毁 ZFS 池？
我有 zfs 池: $ sudo zpool status lxd pool: lxd state: ONLINE scan: none requested config: NAME
multithreading - 斯卡拉的 Actor 池
我有一个基于 Actor 的项目，对于其中的一部分，我必须使用一些接收消息的 Actor ，然后一个 Actor 分别分配给每个请求，每个 Actor 负责执行其消息请求，所以我需要类似线程的东西我的
solaris - 以可写方式打开 ZFS 池
我已经使用 QEMU 模拟器成功地将 FreeBSD 安装到原始图像文件中。我已经使用 ZFS 文件系统 (ZFS POOL) 格式化了图像文件。使用下面的命令我已经成功地挂载了准备好由 zpool
python - 不断运行的 worker 池
我正在使用 multiprocessor.Pool并行处理一些文件。该代码等待接收文件，然后使用 Pool.apply_async 将该文件发送给工作人员。，然后处理文件。这段代码应该一直在运行，
scala - 具有关闭连接的 BoneCp 池
我正在使用带有光滑的 Bonecp 数据源。并发现池包含关闭的连接所以我总是遇到这个异常 java.sql.SQLException: Connection is closed! at com
ruby-on-rails - 如何在Sidekiq中切换Redis主机/池？
我有apartment gem的 Multi-Tenancy Rails应用程序，我可以使用apartment-sidekiq在每个工作程序中成功切换数据库租户。但是，sidekiq worker 正
ZFS 文件系统与 ZFS 池
ZFS 池可能由数据集(文件系统、快照等)或卷组成。 ZFS 卷就像 block 设备，但我不明白池和文件系统之间的区别。当我通过 zpool create pool1 sda sdb sdc 创建
docker - 以编程方式创建 Airflow 池
我在 docker 容器上运行了 airflow。我正在使用 airflow 2.0.2 版。我知道我实际上可以通过 UI 创建池。但我正在寻找一种通过 pools.json 文件在 docker
java - 连接未返回 tomcat 池
我在tomcat中有一个jdbc池，用于建立数据库连接。我在使用后没有显式关闭连接对象。我的“maxActive”参数设置为100。应用程序运行了一段时间，但随后失败进行数据库查询。它会等待无限时间来
java - PostgreSQL JDBC 池
阅读 PostgreSQL 文档 here我读了以下内容: As well, connections requested for users other than the default config
docker - 以编程方式创建 Airflow 池
我在 docker 容器上运行了 airflow。我正在使用 airflow 2.0.2 版。我知道我实际上可以通过 UI 创建池。但我正在寻找一种通过 pools.json 文件在 docker
java - 如何保持固定大小的 ListenableFuture 池？
我正在读取一个大的 URL 文件并向服务发出请求。该请求由返回 ListenableFuture 的客户端执行。现在我想保留一个 ListenableFuture 池，例如最多同时执行 N 个 Fut
python - 池、队列、悬挂
我想使用队列来保存结果，因为我希望消费者(串行而不是并行)在工作人员产生结果时处理工作人员的结果。现在，我想知道为什么以下程序挂起。 import multiprocessing as mp imp
javascript - JQuery Ajax 池
我正在开发一个单页应用程序，目前正在构建一个 JQuery、ajax 函数，以便我的所有调用都能通过。对于一个典型的页面，我可能有 3 个 ajax 调用。我的想法是，如果用户互联网出去将这些 aj
java - 用于不同类型子对象的 Libgdx 池
我有一个单位类及其一些子类(弓箭手、剑客等)。我怎样才能创建一个回收所有单元类型子类的池？最佳答案这是不可能的，因为池只能包含一种特定类型的对象。否则你可能会遇到这样的情况: Pool unitP

首页

博学

6Ren·AI

商城

multithreading - Go 中的简单工作池