- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我经常需要对包含标题的文件集合进行排序。由于排序取决于 header 的内容,因此此用例比类似问题(例如 Is there a way to ignore header lines in a UNIX sort? )更复杂。
我希望使用Python来读取文件,输出第一个文件的 header ,然后通过管道将尾部进行排序。我尝试过将此作为概念证明:
#!/usr/bin/env python
import io
import subprocess
import sys
header_printed = False
sorter = subprocess.Popen(['sort'], stdin=subprocess.PIPE)
for f in sys.argv[1:]:
fd = io.open(f,'r')
line = fd.readline()
if not header_printed:
print(line)
header_printed = True
sorter.communicate(line)
当作为 header-sort fileA fileB
调用时,fileA 和 fileB 包含诸如
c float int
Y 0.557946 413
F 0.501935 852
F 0.768102 709
我得到:
# sort file 1
Traceback (most recent call last):
File "./archive/bin/pipetest", line 17, in <module>
sorter.communicate(line)
File "/usr/lib/python2.7/subprocess.py", line 785, in communicate
self.stdin.write(input)
ValueError: I/O operation on closed file
问题是通信需要一个字符串,并且管道在写入后关闭。这意味着内容必须完全读入内存。通信不需要生成器(我尝试过)。
更简单的演示是:
>>> import subprocess
>>> p = subprocess.Popen(['tr', 'a-z', 'A-Z'], stdin=subprocess.PIPE)
>>> p.communicate('hello')
HELLO(None, None)
>>> p.communicate('world')
Traceback (most recent call last):
File "<ipython-input-14-d6873fd0f66a>", line 1, in <module>
p.communicate('world')
File "/usr/lib/python2.7/subprocess.py", line 785, in communicate
self.stdin.write(input)
ValueError: I/O operation on closed file
所以,问题是,将数据流式传输到 Python 管道中的正确方法是什么(使用 Popen 或其他方式)?
最佳答案
对于您的具体情况,如果您仅通过 subprocess.PIPE
对于单个标准句柄(在您的情况下为 stdin
),那么在您的示例中,您可以安全地调用 sorter.stdin.write(line)
一遍又一遍。写完输出后,请调用 sorter.stdin.close()
所以sort
知道输入已完成,并且它可以执行实际的排序和输出工作(不带参数的 sorter.communicate()
可能也可以工作;否则,在关闭 stdin
后,您可能需要调用 sorter.wait()
让它完成) .
如果您需要处理多个管道标准句柄,正确的方法是 threading
每个管道都有一个专用线程,必须在第一个管道之外进行处理(概念上相对简单,但重量级并且引入了线程的所有令人头疼的问题),或者使用 select
模块(或在 Python 3.4+ 中为 selectors
模块),这很难正确完成,但(在某些情况下)可以更高效。最后,有creating temporary files for output ,这样你就可以直接写入进程的stdin
当进程写入文件时(因此不会阻塞);然后,您可以在闲暇时读取该文件(请注意,子进程不一定会刷新它自己的输出缓冲区,直到它退出,因此输出可能不会立即响应您的输入,直到进一步的输入和输出填充并刷新了缓冲区)。
subprocess.Popen
的.communicate()
方法使用线程或 select
每当您传递 _communicate
时,模块原语本身(取决于操作系统支持;实现位于 various subprocess.PIPE
methods here 下)适用于多个标准 handle ;这就是你必须这样做的方式。
关于python - 使用 subprocess.Popen 将数据流式传输到命令中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32662375/
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 9 年前。 Improve this
我有一系列 SQL 命令,我想在大约 40 个不同的表上运行。必须有一种方法可以在不编写 40 条不同命令的情况下执行此操作... 我在 SQL Server 中运行它。所有表都有不同的名称,我要操作
我习惯在 PHP 中使用命令“mysql_insert_id()”来返回插入到我的数据库中的最后一行的 id。 在 C# 中的 SQLite 中是否有等效的命令? 谢谢! -阿德娜 最佳答案 选择 l
试图找出一种方法来回填 ds 分区 Hive 表的分区。 我知道如何从 CLI 运行 Hive 命令,例如 $HIVE_HOME/bin/hive -e 'select a.col from tab1
我有 .bat 文件。看起来像下一个 ....many commands1 ftp -i -s:copy.txt ...many commands2 copy.txt 包含下一个命令 open ...
基本上我想输入 show 并检查是否有 show 命令或别名已定义并触发它,如果未定义则触发 git show 。 例如 rm 应该执行 rm 但 checkout 应该执行 git checkout
我公司的主数据库是 iSeries 机器,我已经非常习惯使用 DB2 命令和结构。我现在正在尝试做一个小项目,更新一个包含超过 300 万条记录的表。我想出一种比较和“清理”数据的更快方法是使用 My
我想在带有 Node 的终端中制作一个简单的按钮板,并“blessed”用于连接或运行不同的命令。 ----------------------------------------------- _
我们有一个 selenium IDE 脚本,正在转换为 python webdriver。以下命令未转换: [openWindow | http://mywebsite.com/index.php |
我正在学习这个关于从 GIT HUB 下载和安装 Web 文件的在线教程。我进入主题:启动我们的静态网站,系统提示我输入命令以下载和安装 Web 文件。但是,当我输入命令 yarn install 时
我在 shell 脚本中使用 elif 命令时遇到问题,就像在 fortran 中一样。 我有 100 家公司的员工名单。我想屏蔽那些员工少于 500 人的公司。我的脚本是 rm -f categor
我有一些 Linux 命令可以生成 token 。我在 Linux 机器上使用操作系统库形式的 Python 自动化了这些命令。它工作正常。 但是,当我在 Windows 中尝试相同的代码时,它没有返
本文分享自华为云社区《Git你有可能不知道交互式暂存》,作者:龙哥手记。 本节中的几个交互式 Git 命令可以帮助你将文件的特定部分组合成提交。 当你在修改了大量文件后,希望这些改动能拆分为若干提交而
我想知道如何使用 IN 比较语法来做到这一点。 当前的 SQL 查询是: select * from employee where (employeeName = 'AJAY' and month(e
我在这个位置安装了 Hadoop /usr/local/hadoop$ 现在我想列出 dfs 中的文件。我使用的命令是: hduser@ubuntu:/usr/local/hadoop$ bin/ha
是否有一个单一的 docker 命令可用于清除所有内容?如果正在运行,请停止所有容器、删除所有图像、删除所有卷...等。 最佳答案 我认为没有一个命令可以做到这一点。您首先需要停止所有容器使用 $ d
我基本上是在 clojure/nrepl 模式中寻找与 C-u C-x C-e 或 C-c C-p 等效的 Scheme。 我想要一个 C-x C-e 将输出打印到缓冲区,而不是仅仅在 repl 中。
我可以在 vim 中使用 pudb(一个 ncurses Python 调试器),因为,例如,:!python %在实际的终端窗口中运行。我更喜欢使用 gvim,但 gvim 运行 :!python
我正在尝试编写一个 FFMPEG 命令: 取为 输入 一个视频 input.mp4 和一个图像 pic.jpg 作为 输出 将 input.mp4 拆分为 20 秒的视频,按顺序重命名;对于每个分割视
我想转储视频每帧的比特率。我正在尝试使用 -vstats 获取此信息命令。当我运行此命令时 - ffmpeg -i input.mp4 -vstats 它显示至少应该定义一个文件。 如果有人能建议我任
我是一名优秀的程序员,十分优秀!