gpt4 book ai didi

python - 并行化 Python 的 reduce 命令

转载 作者:行者123 更新时间:2023-11-28 22:17:58 24 4
gpt4 key购买 nike

在 Python 中,我正在运行以下形式的命令

reduce(func, bigArray[1:], bigArray[0])

而且我想添加并行处理以加快速度。

我知道我可以通过拆分数组、在单独的部分上运行进程并合并结果来手动执行此操作。

但是,考虑到并行运行 reduce 的普遍性,我想看看是否有一种本地方法或库可以自动执行此操作。

我正在运行一台 6 核机器。

最佳答案

对于遇到这个问题的任何人,我最终编写了一个帮助程序来完成它

def parallelReduce(l, numCPUs, connection=None):

if numCPUs == 1 or len(l) <= 100:
returnVal= reduce(reduceFunc, l[1:], l[0])
if connection != None:
connection.send(returnVal)
return returnVal

parent1, child1 = multiprocessing.Pipe()
parent2, child2 = multiprocessing.Pipe()
p1 = multiprocessing.Process(target=parallelReduce, args=(l[:len(l) // 2], numCPUs // 2, child1, ) )
p2 = multiprocessing.Process(target=parallelReduce, args=(l[len(l) // 2:], numCPUs // 2 + numCPUs%2, child2, ) )
p1.start()
p2.start()
leftReturn, rightReturn = parent1.recv(), parent2.recv()
p1.join()
p2.join()
returnVal = reduceFunc(leftReturn, rightReturn)
if connection != None:
connection.send(returnVal)
return returnVal

请注意,您可以使用 multiprocessing.cpu_count()

获取 CPU 的数量

与串行版本相比,使用此功能可显着提高性能。

关于python - 并行化 Python 的 reduce 命令,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50878960/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com