gpt4 book ai didi

Python 子进程在接收标准输入 EOF 时经历了神秘的延迟

转载 作者:太空宇宙 更新时间:2023-11-03 13:52:22 25 4
gpt4 key购买 nike

我将我在应用程序中看到的问题简化为以下测试用例。在此代码中,一个父进程同时生成 2 个(您可以生成更多)子进程,这些子进程通过标准输入从父进程读取一条大消息,休眠 5 秒,然后写回一些内容。但是,某处发生意外等待,导致代码在 10 秒内完成,而不是预期的 5 秒。

如果设置 verbose=True,您可以看到分散的子进程正在接收大部分消息,然后等待 3 个字符的最后一 block ——它没有检测到管道有被关闭。此外,如果我不对第二个进程执行任何操作 (doreturn=True),第一个进程将永远不会看到 EOF。

知道发生了什么事吗?再往下是一些示例输出。提前致谢。

from subprocess import *
from threading import *
from time import *
from traceback import *
import sys
verbose = False
doreturn = False
msg = (20*4096+3)*'a'
def elapsed(): return '%7.3f' % (time() - start)
if sys.argv[1:]:
start = float(sys.argv[2])
if verbose:
for chunk in iter(lambda: sys.stdin.read(4096), ''):
print >> sys.stderr, '..', time(), sys.argv[1], 'read', len(chunk)
else:
sys.stdin.read()
print >> sys.stderr, elapsed(), '..', sys.argv[1], 'done reading'
sleep(5)
print msg
else:
start = time()
def go(i):
print elapsed(), i, 'starting'
p = Popen(['python','stuckproc.py',str(i), str(start)], stdin=PIPE, stdout=PIPE)
if doreturn and i == 1: return
print elapsed(), i, 'writing'
p.stdin.write(msg)
print elapsed(), i, 'closing'
p.stdin.close()
print elapsed(), i, 'reading'
p.stdout.read()
print elapsed(), i, 'done'
ts = [Thread(target=go, args=(i,)) for i in xrange(2)]
for t in ts: t.start()
for t in ts: t.join()

示例输出:

  0.001 0 starting
0.003 1 starting
0.005 0 writing
0.016 1 writing
0.093 0 closing
0.093 0 reading
0.094 1 closing
0.094 1 reading
0.098 .. 1 done reading
5.103 1 done
5.108 .. 0 done reading
10.113 0 done

如果有不同,我正在使用 Python 2.6.5。

最佳答案

经过太多时间,我在引用 this post 后弄明白了向我跳了出来:

See the "I/O on Pipes and FIFOs" section of pipe(7) ("man 7 pipe")

"If all file descriptors referring to the write end of a pipe have been closed, then an attempt to read(2) from the pipe will see end-of-file (read(2) will return 0)."

我早该知道这一点,但我从未想过 - 尤其是与 Python 无关。发生的事情是:子进程使用打开(编写器)文件描述符 fork 到彼此的管道。只要管道有打开的写入器文件描述符,读取器就不会看到 EOF。

例如:

p1=Popen(..., stdin=PIPE, ...) # creates a pipe the parent process can write to
p2=Popen(...) # inherits the writer FD - as long as p2 exists, p1 won't see EOF

原来Popen有一个close_fds参数,所以解决办法是传递close_fds=True。事后看来,这一切都简单明了,但仍然设法花费了至少几个眼球的大量时间。

关于Python 子进程在接收标准输入 EOF 时经历了神秘的延迟,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4940607/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com