python - Python 多处理中提前终止时的死锁-6ren

python - Python 多处理中提前终止时的死锁

转载作者：太空宇宙更新时间：2023-11-03 15:15:51

30

4

我正在 Python 中创建一个 multiprocessing.Queue 并将 multiprocessing.Process 实例添加到此 Queue。

我想添加一个在每个作业之后执行的函数调用，它检查特定任务是否成功。如果是这样，我想清空队列并终止执行。

我的Process类是:

class Worker(multiprocessing.Process):

    def __init__(self, queue, check_success=None, directory=None, permit_nonzero=False):
        super(Worker, self).__init__()
        self.check_success = check_success
        self.directory = directory
        self.permit_nonzero = permit_nonzero
        self.queue = queue

    def run(self):
        for job in iter(self.queue.get, None):
            stdout = mbkit.dispatch.cexectools.cexec([job], directory=self.directory, permit_nonzero=self.permit_nonzero)
            with open(job.rsplit('.', 1)[0] + '.log', 'w') as f_out:
                f_out.write(stdout)
            if callable(self.check_success) and self.check_success(job):
                # Terminate all remaining jobs here
                pass

我的队列设置在这里:

class LocalJobServer(object):

    @staticmethod
    def sub(command, check_success=None, directory=None, nproc=1, permit_nonzero=False, time=None, *args, **kwargs):
        if check_success and not callable(check_success):
            msg = "check_success option requires a callable function/object: {0}".format(check_success)
            raise ValueError(msg)

        # Create a new queue
        queue = multiprocessing.Queue()
        # Create workers equivalent to the number of jobs
        workers = []
        for _ in range(nproc):
            wp = Worker(queue, check_success=check_success, directory=directory, permit_nonzero=permit_nonzero)
            wp.start()
            workers.append(wp)
        # Add each command to the queue
        for cmd in command:
            queue.put(cmd, timeout=time)
        # Stop workers from exiting without completion
        for _ in range(nproc):
            queue.put(None)
        for wp in workers:
            wp.join()

函数调用mbkit.dispatch.cexectools.cexec()是subprocess.Popen的包装器，并返回p.stdout。

在 Worker 类中，我编写了条件来检查作业是否成功，并尝试使用 while 清空 Queue 中的剩余作业 循环，即我的 Worker.run() 函数如下所示:

def run(self):
    for job in iter(self.queue.get, None):
        stdout = mbkit.dispatch.cexectools.cexec([job], directory=self.directory, permit_nonzero=self.permit_nonzero)
        with open(job.rsplit('.', 1)[0] + '.log', 'w') as f_out:
            f_out.write(stdout)
        if callable(self.check_success) and self.check_success(job):
            break
    while not self.queue.empty():
        self.queue.get()

虽然这有时有效，但通常会死锁，我唯一的选择是Ctrl-C。我知道 .empty() 不可靠，因此我的问题。

关于如何实现这种提前终止功能有什么建议吗？

最佳答案

这里没有陷入僵局。它仅与 multiprocessing.Queue 的行为相关，因为 get 方法默认是阻塞的。因此，当您在空队列上调用 get 时，调用会停止，等待下一个元素准备好。您可以看到，您的一些工作线程将会停止，因为当您使用循环 while not self.queue.empty() 来清空它时，您会删除所有 None 哨兵，并且您的一些工作人员将阻塞在空的 Queue 上，如以下代码所示:

from multiprocessing import Queue
q = Queue()
for e in iter(q.get, None):
    print(e)

要在队列为空时收到通知，您需要使用非阻塞调用。例如，您可以使用 q.get_nowait，或在 q.get(timeout=1) 中使用超时。当队列为空时，两者都会抛出 multiprocessing.queues.Empty 异常。因此，您应该将 Worker for job in iter(...): 循环替换为以下内容:

while not queue.empty():
    try:
        job = queue.get(timeout=.1)
    except multiprocessing.queues.Empty:
        continue
    # Do stuff with your job

如果您不想在任何时候陷入困境。

对于同步部分，我建议使用同步原语，例如 multiprocessing.Condition或 multiprocessing.Event 。这比值(value)更清晰，因为它们是为此目的而设计的。像这样的事情应该有帮助

def run(self):
    while not queue.empty():
        try:
            job = queue.get(timeout=.1)
        except multiprocessing.queues.Empty:
            continue
        if self.event.is_set():
            continue
        stdout = mbkit.dispatch.cexectools.cexec([job], directory=self.directory, permit_nonzero=self.permit_nonzero)
        with open(job.rsplit('.', 1)[0] + '.log', 'w') as f_out:
            f_out.write(stdout)
        if callable(self.check_success) and self.check_success(job):
            self.event.set()
    print("Worker {} terminated cleanly".format(self.name))

与event = multiprocessing.Event()。

请注意，也可以使用multiprocessing.Pool来避免处理队列和工作人员。但由于您需要一些同步原语，因此设置可能会稍微复杂一些。像这样的东西应该有效:

 def worker(job, success, check_success=None, directory=None, permit_nonzero=False):
      if sucess.is_set():
          return False
      stdout = mbkit.dispatch.cexectools.cexec([job], directory=self.directory, permit_nonzero=self.permit_nonzero)
      with open(job.rsplit('.', 1)[0] + '.log', 'w') as f_out:
          f_out.write(stdout)
      if callable(self.check_success) and self.check_success(job):
          success.set()
      return True

# ......
# In the class LocalJobServer
# .....

def sub(command, check_success=None, directory=None, nproc=1, permit_nonzero=False):

    mgr = multiprocessing.Manager()
    success = mgr.Event()

    pool = multiprocessing.Pool(nproc)
    run_args = [(cmd, success, check_success, directory, permit_nonzero)]
    result = pool.starmap(worker, run_args)

    pool.close()
    pool.join()

请注意，我使用管理器，因为您无法直接将 multiprocessing.Event 作为参数传递。您还可以使用 Pool 的参数 initializer 和 initargs 在每个工作线程中启动全局 success 事件并避免依赖于Manager，但稍微复杂一些。

关于python - Python 多处理中提前终止时的死锁，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/43900219/

30

4

0

文章推荐： php - 为什么 https 只适用于主页？ (WordPress)

文章推荐： python - 用不同的颜色为一条线设置动画

文章推荐： c# - 在 MVVM 类初始化后执行异步方法

文章推荐： rest - 在 EC2 实例 (FQDN) 上设置 SSL

Java并发多线程编程——锁
一、公平锁和非公平锁 1.1、公平锁和非公平锁的概述公平锁：指多个线程按照申请锁的顺序来获取锁。非公平锁：指在多线程获取锁的顺序并不是按照申请锁的顺序，有可能后申请的线程比先申请的线程优先获取到锁
MySQL高级9-锁
阅读目录 1、简介 2、分类 3、全局锁 4、表级锁 5、表锁 6、元数据锁
concurrency - 锁/条件变量问题
因此，在我编写的程序中，我有三个函数，为了简单起见，我们将它们称为 A、B 和 C。每个函数都需要访问资源X才能工作。限制是A和B不允许同时运行并且必须适当同步。但是，C 可以与 A 或 B 同时运
concurrency - 锁、互斥量和信号量有什么区别？
我听说过这些与并发编程相关的词，但是锁、互斥量和信号量之间有什么区别？最佳答案锁只允许一个线程进入被锁定的部分，并且该锁不与任何其他进程共享。互斥锁与锁相同，但它可以是系统范围的(由多个进程共享
java - 线程安全单例、锁
这个问题已经有答案了: What is an efficient way to implement a singleton pattern in Java? [closed] (29 个回答) 已关闭
java - 线程安全单例、锁
这个问题已经有答案了: What is an efficient way to implement a singleton pattern in Java? [closed] (29 个回答) 已关闭
事务、锁、隔离级别
我对标题中的主题有几个问题。首先，假设我们使用 JDBC，并且有 2 个事务 T1 和 T2。在 T1 中，我们在一个特定的行上执行 select 语句。然后我们对该行执行更新。在事务 T2 中，我们
MySql:如何在存储过程中使用互斥锁/锁
我希望我的函数只运行一次。这意味着如果多个线程同时调用它，该函数将阻塞所有线程，只允许它运行。最佳答案听起来您希望存储过程进行同步。为什么不直接将同步放在应用程序本身中。 pthread_mute
C# 锁(this)方法
if (runInDemoMode) { lock (this) { //Initalization of tables dCreator.create
java - 挑剔的主机(锁？)
我相信无论使用什么语言都可以考虑我的问题，但是为了有一些“ anchor ”，我将使用 Java 语言来描述它。让我们考虑以下场景:我有一个扩展 Thread 的类 PickyHost 及其实例 p
JavaScript、异步、锁？
我知道异步不是并行的，但我现在遇到了一个非常有趣的情况。 async function magic(){ /* some processing here */ await async () =
java - 在未来的代码中使用同步/锁
我们正在使用 Scala、Play 框架和 MongoDB(以 ReactiveMongo 作为我们的驱动程序)构建一个网络应用程序。应用程序架构是端到端的非阻塞。在我们代码的某些部分，我们需要访问
java - JavaME 锁
我需要一个简单的锁，JavaME 超时(concurrent.lock 的反向移植需要完整的 Java 1.3)。如果其他人已经为 JavaME 发布了经过测试的锁定代码，我宁愿使用它。锁定是出了
c++ - 锁()的实现
根据 boost : To access the object, a weak_ptr can be converted to a shared_ptr using the shared_ptr co
c++ - 锁、互斥和临界区之间的区别
关于 Mutex 和 Critical 部分之间的区别存在一个问题，但它也不处理 Locks。所以我想知道临界区是否可以用于进程之间的线程同步。还有信号状态和非信号状态的含义最佳答案在 Win
c#.NET高级编程高并发必备技巧-锁
锁最为常见的应用就是高并发的情况下，库存的控制。本次只做简单的单机锁介绍。直接看代码：每请求一次库存-1. 假如库存1000，在1000个人请求之后，库存将变为0。
详解python多线程、锁、event事件机制的简单使用
线程和进程 1、线程共享创建它的进程的地址空间,进程有自己的地址空间 2、线程可以访问进程所有的数据，线程可以相互访问 3、线程之间的数据是独立的 4、子进程复制线程的数据 5、子进程启动
这把“锁”不简单，让你畅游数字世界
**摘要：**细心的你也一定关注到，有的网址是https开头的，有的是http。https开头的网站前面，会有一把小锁。这是为什么呢？本文分享自华为云社区《还不知道SSL证书已经是刚需了？赶快来了解
c - 互斥量(锁)的所有权是如何实现的？
试图在 C 中实现一个非常简单的互斥锁(锁)我有点困惑。我知道互斥锁类似于二进制信号量，除了互斥锁还强制执行释放锁的线程的约束，必须是最近获得它的同一线程。我对如何跟踪所有权感到困惑？这是我到目前为
SQL Server 锁 - 避免插入重复条目
在阅读了很多与上述主题相关的文章和答案之后，我仍然想知道 SQL Server 数据库引擎在以下示例中是如何工作的: 假设我们有一个名为 t3 的表: create table t3 (a int ,

首页

博学

6Ren·AI

商城

python - Python 多处理中提前终止时的死锁