- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我正在编写一个 python 脚本,它可以像这样通过管道从另一个命令读取输入
batch_job | myparser
我的脚本 myparser
处理 batch_job
的输出并写入它自己的标准输出。我的问题是我想立即看到输出(batch_job 的输出是逐行处理的)但是似乎有这个臭名昭著的标准输入缓冲(据称是 4KB,我还没有验证)延迟了一切。
我尝试了以下方法:
os.fdopen(sys.stdin.fileno(), 'r', 0)
打开标准输入-u
:#!/usr/bin/python -u
export PYTHONUNBUFFERED=1
我的 python 版本是 2.4.3 - 我无法升级或安装任何其他程序或软件包。我怎样才能摆脱这些延迟?
最佳答案
我在遗留代码中遇到过同样的问题。这似乎是 Python 2 的 file
对象的 __next__
方法的实现问题;它使用 Python 级缓冲区(-u
/PYTHONUNBUFFERED=1
不影响,因为那些只取消缓冲 stdio
FILE *
本身,但是 file.__next__
的缓冲不相关;同样,stdbuf
/unbuffer
不能改变任何缓冲,因为 Python 替换了 C 运行时创建的默认缓冲区;file.__init__
对新打开的文件所做的最后一件事是调用 PyFile_SetBufSize
,它使用 setvbuf
/setbuf
[API] 来替换默认的 stdio
缓冲区)。
当您有以下形式的循环时会出现问题:
for line in sys.stdin:
对 __next__
的第一次调用(由 for
循环隐式调用以获取每个 line
)最终阻塞以填充之前的 block 生产单线。
存在三种可能的修复方法:
(仅适用于 Python 2.6+)使用 io
模块(作为内置从 Python 3 向后移植)重新包装 sys.stdio
以绕过 file
完全支持(坦率地说是优越的)Python 3 设计(它一次使用一个系统调用来填充缓冲区,而不会阻塞整个请求的读取;如果它要求 4096 字节并得到3, 它将查看是否有一行可用并生成它)所以:
import io
import sys
# Add buffering=0 argument if you won't always consume stdin completely, so you
# can't lose data in the wrapper's buffer. It'll be slower with buffering=0 though.
with io.open(sys.stdin.fileno(), 'rb', closefd=False) as stdin:
for line in stdin:
# Do stuff with the line
这通常比选项 2 更快,但更冗长,并且需要 Python 2.6+。它还允许重新包装是 Unicode 友好的,通过将模式更改为 'r'
并可选择传递输入的已知 encoding
(如果它不是区域设置默认值)无缝获取 unicode
行而不是(仅限 ASCII)str
。
(任何版本的 Python)通过使用 file.readline
解决 file.__next__
的问题;尽管预期的行为几乎相同,readline
并没有做自己的(过度)缓冲,它委托(delegate)给 C stdio
的 fgets
(默认构建settings) 或手动循环调用 getc
/getc_unlocked
进入缓冲区,该缓冲区在到达行尾时准确停止。通过将它与双参数 iter
结合使用,您可以获得几乎相同的代码而不会过于冗长(它可能比之前的解决方案慢,具体取决于是否使用 fgets
引擎盖,以及 C 运行时如何实现它):
# '' is the sentinel that ends the loop; readline returns '' at EOF
for line in iter(sys.stdin.readline, ''):
# Do stuff with line
移至 Python 3,它没有这个问题。 :-)
关于python - 在 python 中从 stdin 无缓冲读取,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33305131/
我有以下代码可以完全按预期工作: from subprocess import Popen process = Popen( ["/bin/bash"], stdin=sys.stdi
我有一个关于 php-cli 的新问题。 我正在使用这个: define("STDIN", fopen('php://stdin','r')); $input = ""; while($input =
这个问题在这里已经有了答案: Can fseek(stdin,1,SEEK_SET) or rewind(stdin) be used to flush the input buffer inste
我正在编写一个 python 程序,它将所有输入都大写(替代非工作 tr '[:lowers:]' '[:upper:]')。语言环境是 ru_RU.UTF-8,我使用 PYTHONIOENCODIN
自从我发现 fflush(stdin) 不是处理熟悉的“换行潜伏在输入缓冲区中”问题的可移植方法,我一直在使用当我必须使用scanf时如下: while((c = getchar()) != '\n'
当我使用时在 Perl 模块( *.pm )文件中,它不会从键盘读取输入,但是当我使用 时在同一个地方它工作得很好。 为什么我使用时没有得到输入? 最佳答案 STDIN 是记录的文件句柄。还有 st
stdin 是否是一个指针,正如我在 fgets() 中看到的那样。 我使用“0”作为标准输入的读取或写入错误,并在 fgets 期间出现段错误。 STDIN宏和0是否相同。 stdin 是文件指针吗
我想知道 STDIN 和 $stdin 之间是否有任何真正的区别。我在 irb: STDIN == $stdin 并返回 true。它们只是同一事物的两个名称吗?还是有什么不同? 最佳答案 来自 Ru
有没有一种简单的方法可以将内容通过管道传输到编辑器原子? 例如: echo "Content." | atom 不幸的是atom没有获取到内容。当前版本的 gedit 具有参数 - 以启用读取 STD
这个问题已经有答案了: Using fflush(stdin) (7 个回答) 已关闭 9 年前。 我有一个这样的测试代码 #include #include #include int main
我有一个 bash启动 scp 的脚本通过以下方式: echo "${SCP_PASS:-$PASSWORD}" | ( exec 3<&0; scp -qp ${SCP_PORT:+-P$SCP_P
我正在创建一个 NASM 汇编代码来从标准输入读取文件中存在的二维数字数组我正在运行这样的可执行文件 -> ./abc < input.txt . 之后,我将在终端上显示读取的二维数组,然后我想获取箭
这是一个循环,它重复地从 stdin 获取两个字符并输出它们。 char buf[2]; while (1) { printf("give me two characters: ");
我有一个 golang 程序,可以为 jq 做一个简单的 repl。 .我希望能够在程序启动时从 stdin 读取输入到一个临时文件中,这样我就可以将 repl 与管道输入一起使用。 cat file
有没有非阻塞的 PHP 从 STDIN 读取: 我试过了: stream_set_blocking(STDIN, false); echo fread(STDIN, 1); 还有这个: $stdin
这实际上与我已经回答的另一个问题有关。这个问题在这里:Redirecting stdout of one process object to stdin of another 我的问题是(我认为)获取
我只是一个java初学者,目前正在大学学习,但由于某些原因我不会深入,我无法询问我的导师。 我在 Netbeans 中使用 StdIn 库时遇到问题。在类里面我们使用 DrJava,但由于我无法让它在
Ruby 有两种引用标准输入的方法:STDIN 常量和$stdin 全局变量。 除了我可以将不同的 IO 对象分配给 $stdin 因为它不是常量(例如,在我的 child 中 fork 重定向 IO
我是 Pythonizer 的作者我正在尝试将 CGI.pm 的代码从标准 perl 库转换为 Python。我在 read_from_client 中看到这段代码: read(\*STDIN, $$
我正在使用 laravel 5.6 并遇到问题,当我在控制台中使用命令“php artisan vendor:publish”时,出现以下错误: [ERROR] Use of undefined co
我是一名优秀的程序员,十分优秀!