- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在使用 multiprocessing
生成 4 的 python 库 Process()
对象并行化 cpu 密集型任务。任务(来自这个伟大的 article 的灵感和代码)是计算列表中每个整数的质因数。
main.py:
import random
import multiprocessing
import sys
num_inputs = 4000
num_procs = 4
proc_inputs = num_inputs/num_procs
input_list = [int(1000*random.random()) for i in xrange(num_inputs)]
output_queue = multiprocessing.Queue()
procs = []
for p_i in xrange(num_procs):
print "Process [%d]"%p_i
proc_list = input_list[proc_inputs * p_i:proc_inputs * (p_i + 1)]
print " - num inputs: [%d]"%len(proc_list)
# Using target=worker1 HANGS on join
p = multiprocessing.Process(target=worker1, args=(p_i, proc_list, output_queue))
# Using target=worker2 RETURNS with success
#p = multiprocessing.Process(target=worker2, args=(p_i, proc_list, output_queue))
procs.append(p)
p.start()
for p in jobs:
print "joining ", p, output_queue.qsize(), output_queue.full()
p.join()
print "joined ", p, output_queue.qsize(), output_queue.full()
print "Processing complete."
ret_vals = []
while output_queue.empty() == False:
ret_vals.append(output_queue.get())
print len(ret_vals)
print sys.getsizeof(ret_vals)
观察:
worker1
,对于大于 4000 个元素的输入列表,主线程会卡在 .join()
上,等待生成的进程终止并且永不返回。worker2
,对于相同的输入列表,代码工作正常并且主线程返回。这让我很困惑,因为 worker1
和 worker2
之间的唯一区别(见下文)是前者在 Queue
而后者为每个进程插入一个列表列表。
为什么使用 worker1
而没有使用 worker2
目标会出现死锁?不应该两者(或两者都不)超出 Multiprocessing Queue maxsize limit is 32767 ?
worker1 与 worker2:
def worker1(proc_num, proc_list, output_queue):
'''worker function which deadlocks'''
for num in proc_list:
output_queue.put(factorize_naive(num))
def worker2(proc_num, proc_list, output_queue):
'''worker function that works'''
workers_stuff = []
for num in proc_list:
workers_stuff.append(factorize_naive(num))
output_queue.put(workers_stuff)
SO 上有很多 类似的问题,但我相信这些问题的核心与所有这些问题明显不同。
相关链接:
最佳答案
The docs对此发出警告:
Warning: As mentioned above, if a child process has put items on a queue (and it has not used JoinableQueue.cancel_join_thread), then that process will not terminate until all buffered items have been flushed to the pipe.
This means that if you try joining that process you may get a deadlock unless you are sure that all items which have been put on the queue have been consumed. Similarly, if the child process is non-daemonic then the parent process may hang on exit when it tries to join all its non-daemonic children.
虽然 Queue
看起来是无界的,但在幕后,排队的项目在内存中缓冲以避免进程间管道过载。在刷新这些内存缓冲区之前,进程无法正常结束。您的 worker1()
将比您的 worker2()
更多的项目放在队列中,仅此而已。请注意,在实现诉诸内存缓冲之前可以排队的项目数量没有定义:它可能因操作系统和 Python 版本而异。
正如文档所建议的,避免这种情况的正常方法是.get()
在您尝试之前关闭队列中的所有项目.join()
进程。正如您所发现的,是否有必要这样做取决于每个工作进程已将多少项目放入队列中的未定义方式。
关于python multiprocessing .join() 死锁取决于工作函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45948463/
我有类似下面的代码: ... id: myComponent signal updateState() property variant modelList: [] Repeater { mo
我正在处理一些我无法展示的私有(private)代码,但我已经制作了一些示例代码来描述我的问题: 主.c: #include #include #include #include typede
这个问题在这里已经有了答案: 关闭10 年前。 Possible Duplicate: what are the differences in die() and exit() in PHP? 我想
在编写 Perl 模块时,在模块内部使用 croak/die 是一个好习惯吗? 毕竟,如果调用者不使用 eval block ,模块可能会使调用它的程序崩溃。 在这些情况下,最佳做法是什么? 最佳答案
我有一些搜索线程正在存储结果。我知道当线程启动时,JVM native 代码会代理在操作系统上创建新 native 线程的请求。这需要 JVM 之外的一些内存。当线程终止并且我保留对它的引用并将其用作
我刚刚花了很多时间调试一个我追溯到 wantarray() 的问题。 .我已将其提炼为这个测试用例。 (忽略 $! 在这种情况下不会有任何有用信息的事实)。我想知道为什么wantarray在第二个示例
我看到一些代码是这样做的: if(something){ echo 'exit from program'; die; } ...more code 和其他只使用 die 的人: if
我正在尝试将此表格用于: 如果任何 $_POST 变量等于任何其他 $_POST 变量抛出错误。 如果只有几个,那不是问题,但我有大约 20 个左右所以如果我想这样做,我将不得不像这样 但这
每次我运行: hadoop dfsadmin -report 我得到以下输出: Configured Capacity: 0 (0 KB) Present Capacity: 0 (0 KB) DFS
我是一名优秀的程序员,十分优秀!