gpt4 book ai didi

带有工作进程的 python 池

转载 作者:IT老高 更新时间:2023-10-28 22:10:57 28 4
gpt4 key购买 nike

我正在尝试使用进程对象在 python 中使用工作池。每个 worker (一个进程)进行一些初始化(花费大量时间),传递一系列作业(理想情况下使用 map()),并返回一些东西。除此之外,不需要任何沟通。但是,我似乎无法弄清楚如何使用 map() 来使用我的 worker 的 compute() 函数。

from multiprocessing import Pool, Process

class Worker(Process):
def __init__(self):
print 'Worker started'
# do some initialization here
super(Worker, self).__init__()

def compute(self, data):
print 'Computing things!'
return data * data

if __name__ == '__main__':
# This works fine
worker = Worker()
print worker.compute(3)

# workers get initialized fine
pool = Pool(processes = 4,
initializer = Worker)
data = range(10)
# How to use my worker pool?
result = pool.map(compute, data)

是作业队列代替,还是我可以使用 map()

最佳答案

我建议您为此使用队列。

class Worker(Process):
def __init__(self, queue):
super(Worker, self).__init__()
self.queue = queue

def run(self):
print('Worker started')
# do some initialization here

print('Computing things!')
for data in iter(self.queue.get, None):
# Use data

现在您可以开始一堆这些,所有这些都从一个队列中获取工作

request_queue = Queue()
for i in range(4):
Worker(request_queue).start()
for data in the_real_source:
request_queue.put(data)
# Sentinel objects to allow clean shutdown: 1 per worker.
for i in range(4):
request_queue.put(None)

这样的事情应该可以让您将昂贵的启动成本分摊给多个 worker 。

关于带有工作进程的 python 池,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9038711/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com