Python多处理比单线程慢-6ren

Python多处理比单线程慢

转载作者：行者123 更新时间：2023-11-28 21:09:31

24

4

我一直在研究多处理问题，并注意到我的算法在并行化时比在单线程时慢。

在我的代码中，我不共享内存。而且我很确定我的算法(见代码)，它只是嵌套循环，是 CPU 绑定(bind)的。

但是，无论我做什么。并行代码在我所有的计算机上运行速度慢 10-20%。

我还在 20 个 CPU 的虚拟机上运行了这个，单线程每次都比多线程好(实际上比我的电脑还慢)。

from multiprocessing.dummy import Pool as ThreadPool
from multi import chunks
from random import random
import logging
import time
from multi import chunks

## Product two set of stuff we can iterate over
S = []
for x in range(100000):
  S.append({'value': x*random()})
H =[]
for x in range(255):
  H.append({'value': x*random()})

# the function for each thread
# just nested iteration
def doStuff(HH):
  R =[]
  for k in HH['S']:
    for h in HH['H']:
      R.append(k['value'] * h['value'])
  return R

# we will split the work
# between the worker thread and give it
# 5 item each to iterate over the big list
HChunks = chunks(H, 5)
XChunks = []

# turn them into dictionary, so i can pass in both
# S and H list
# Note: I do this because I'm not sure if I use the global
# S, will it spend too much time on cache synchronizatio or not
# the idea is that I dont want each thread to share anything.
for x in HChunks:
  XChunks.append({'H': x, 'S': S})

print("Process")
t0 = time.time()
pool = ThreadPool(4)
R = pool.map(doStuff, XChunks)
pool.close()
pool.join()

t1 = time.time()

# measured time for 4 threads is slower 
# than when i have this code just do 
# doStuff(..) in non-parallel way
# Why!?

total = t1-t0
print("Took", total, "secs")

有许多相关问题已打开，但很多都是针对代码结构不正确的——每个 worker 都受 IO 限制等。

最佳答案

您正在使用多线程，而不是多处理。虽然许多语言允许线程并行运行，但 Python 不允许。线程只是一个单独的控制状态，即它拥有自己的堆栈、当前函数等。python 解释器只是不时地在执行每个堆栈之间切换。

基本上，所有线程都在单个内核上运行。它们只会在您不受 CPU 限制时加速您的程序。

multiprocessing.dummy replicates the API of multiprocessing but is no more than a wrapper around the threading module.

如果您受 CPU 限制，多线程通常比单线程慢。这是因为工作和处理资源保持不变，但是您增加了管理线程的开销，例如在它们之间切换。

如何解决这个问题:不要使用 from multiprocessing.dummy import Pool as ThreadPool 而是使用 multiprocessing.Pool as ThreadPool。

您可能想阅读 GIL，即全局解释器锁。这就是阻止线程并行运行的原因(以及对单线程性能的影响)。 CPython 以外的 Python 解释器可能没有 GIL，并且能够在多个内核上运行多线程。

关于Python多处理比单线程慢，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/38217449/

24

4

0

文章推荐： python - 在 apply 中向量化一个非常简单的 pandas lambda 函数

文章推荐： c# - ASP.NET 从 anchor 获取以 px 为单位的文本位置

文章推荐： ios - ScanForPeripheral 状态保留与恢复 iOS

文章推荐： python - 使用 pandas.DataFrame.mean 时返回一个 pandas DataFrame

C++ 单线。在同一行上构造对象和调用函数是否合法
此代码似乎在启用优化的广泛使用的编译器上中断，尽管它在 Visual Studio 中运行良好。 struct foo { foo(int a) { s[0] = '0'+a%10;s[1]
javascript - 带箭头的 highcharts 单线
我想要一个图表，其中有一个单线箭头，如下所示: 1 2 3 4 5 或者像这样(其中/假设是一个箭头:)): \/ -----------------
java - 单线 Sonar 插件maven测试中的多个问题
我正在为 Java 编写自定义规则。有两个 Tree.KIND 实例(STRING_LITERAL 和 ASSIGNMENT)需要捕获。有一个特定的行，字符串文字和赋值的逻辑都会引发问题。但 Sona
ruby - FizzBuzz Ruby 单线
Rosettacode.org 在 Ruby 中有这个出色的单行 FizzBuzz 解决方案。 1.upto(100){|n|puts'FizzBuzz '[i=n**4%-15,i+13]||n
linux - 单线 FTP 服务器
很多时候我使用了这个命令，它在当前目录打开了一个临时的 HTTP 服务器: python3 -m http.server 现在我需要接收文件，有没有打开ftp服务器的一行命令？我只是在寻找一个命令行
c++ - 非指针上的 RAII 单线？
相关主题 std::unique_ptr, deleters and the Win32 API 要将 Win32 句柄用作 RAII，我可以使用以下行 std::unique_ptr::type,
java - 用于转换不可变列表的 Guava 单线
我认为必须有一个单行 Guava 解决方案来将一个不可变列表转换为另一个不可变列表，但我找不到它。假设我们有以下对象: ImmutableList input = ImmutableList.of("
javascript - Highcharts 网格线宽度(或颜色)- 单线
我有以下 Highcharts ( http://www.highcharts.com ) 散点图。请注意，轴从 -10 开始，到 10 停止，中间为 0。我希望每条 0 线的宽度或颜色都与其他线不同
audio - 单线 FFMPEG cmd 合并视频/音频并保留两个音频
我有一个项目需要将一个视频文件与另一个音频文件合并。预期的输出是一个视频文件，其中包含来自实际视频的音频和合并后的音频文件。输出视频文件的长度将与实际视频文件的大小相同。是否有单行 FFMPEG 命
用于 2 个列表字符串格式的 Python 3 单线？
我在 python3 类中有 2 个列表: self.keys = ["a","b","c","d"] self.values = [1,2,3,4] len(self.keys) == len(se
python - 用于将不等长 np.array 组合到矩阵(或二维数组)的 numpy 单线
我有一个不同长度的数组列表，我想将它们组合成一个最大维度的矩阵，并在末尾填充零。例如(伪代码): combine( [1,2,3], [4,5]) [[1,2,3],[4,5,0]] 这是我目前的解决
第 i 个位置为 1 的 n 向量的 Matlab/Octave 单线
例如，给定 i=5 和 n=8，我想生成 [0;0;0;0;1;0; 0;0]。具体来说，我想生成向量 v 以便: v = zeros(n,1); v(i) = 1; 有没有一种(合理的)方法可以在一

首页

博学

6Ren·AI

商城

Python多处理比单线程慢