- mongodb - 在 MongoDB mapreduce 中,如何展平值对象?
- javascript - 对象传播与 Object.assign
- html - 输入类型 ="submit"Vs 按钮标签它们可以互换吗?
- sql - 使用 MongoDB 而不是 MS SQL Server 的优缺点
outfile.txt 输-6ren">
如何使用 Python subprocess
执行以下 shell 命令模块?
echo "input data" | awk -f script.awk | sort > outfile.txt
输入数据将来自一个字符串,所以我实际上不需要echo
。我已经做到了这一点,谁能解释我如何让它通过 sort
进行管道传输?
p_awk = subprocess.Popen(["awk","-f","script.awk"],
stdin=subprocess.PIPE,
stdout=file("outfile.txt", "w"))
p_awk.communicate( "input data" )
更新:请注意,虽然下面接受的答案实际上并没有回答所问的问题,但我相信 S.Lott 是正确的,最好避免一开始就解决这个问题!
最佳答案
你会更高兴以下。
import subprocess
awk_sort = subprocess.Popen( "awk -f script.awk | sort > outfile.txt",
stdin=subprocess.PIPE, shell=True )
awk_sort.communicate( b"input data\n" )
将部分工作委托(delegate)给 shell。让它通过管道连接两个进程。
您会更高兴将“script.awk”重写为 Python,消除 awk 和管道。
编辑。建议 awk 没有帮助的一些原因。
[评论回复的理由太多了。]
Awk 正在添加一个没有重要值(value)的步骤。 awk 的处理没有什么独特之处是 Python 无法处理的。
对于大型数据集,从 awk 到排序的流水线可能会缩短处理时间。对于短数据集,它没有显着的好处。 awk >file 的快速测量;排序文件
和awk | sort
将显示并发帮助。使用排序,它很少有帮助,因为排序不是一次性过滤器。
“Python 到排序”处理(而不是“Python 到 awk 到排序”)的简单性避免了在这里提出确切类型的问题。
Python - 虽然比 awk 更冗长 - 也是显式的,其中 awk 具有某些对新手不透明的隐含规则,并且让非专业人士感到困惑。
Awk(就像 shell 脚本本身一样)添加了另一种编程语言。如果所有这些都可以用一种语言(Python)完成,那么消除 shell 和 awk 编程就消除了两种编程语言,让人们可以专注于任务中产生值(value)的部分。
底线:awk 不能增加重要的值(value)。在这种情况下,awk 是净成本;它增加了足够的复杂性,因此有必要提出这个问题。删除 awk 将是一个净 yield 。
侧边栏为什么构建管道 (a | b
) 如此困难。
当shell遇到a | b
它必须执行以下操作。
fork 原始 shell 的子进程。这最终会变成b。
构建一个操作系统管道。 (不是 Python subprocess.PIPE),而是调用 os.pipe()
,它返回两个通过公共(public)缓冲区连接的新文件描述符。此时,该进程具有来自其父级的标准输入、标准输出、标准错误,以及一个将是“a 的标准输出”和“b 的标准输入”的文件。
叉一个 child 。 child 用新的 a 的标准输出替换它的标准输出。执行 a
进程。
b 子关闭用新 b 的标准输入替换它的标准输入。执行 b
进程。
b 子进程等待 a 完成。
父级正在等待 b 完成。
我认为上面可以递归地用来生成 a |乙 | c
,但是你必须隐式地给长管道加上括号,把它们当作 a | (b | c)
.
由于Python有os.pipe()
、os.exec()
和os.fork()
,你可以替换sys.stdin
和 sys.stdout
,有一种方法可以在纯 Python 中完成上述操作。实际上,您也许可以使用 os.pipe()
和 subprocess.Popen
来制定一些快捷方式。
但是,将该操作委托(delegate)给 shell 会更容易。
关于python - 如何使用 subprocess.Popen 通过管道连接多个进程?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/295459/
我在这里看到这个帖子很多次了;但未能从命令中捕获故意错误。迄今为止我找到的最好的部分工作.. from Tkinter import * import os import Image, ImageTk
我正在尝试使用 Python 在我的服务器上进行一些基本的模块设置。这有点困难,因为我无法访问互联网。 这是我的代码 import sys import os from subprocess impo
这个问题在这里已经有了答案: Why does passing variables to subprocess.Popen not work despite passing a list of ar
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
使用 subprocess.call 时,输出符合预期。 result = subprocess.call([securefx, '/NoPrompt', '/Q', '/RetryCount', r
当我使用 subprocess.Popen 或 subprocess.call 执行生成大量输出的命令行时,python 脚本挂起,但奇怪的是,等待一段时间后,脚本处于挂起状态,发现cmd命令的作业已
我是 subprocess 模块的新手,文档让我想知道 subprocess.popen 和 subprocess.run 之间有什么区别.命令的作用有区别吗?一个只是更新吗?哪个更好用? 最佳答案
我需要限制使用 subprocess.call 从 python 进程生成的外部命令行应用程序占用的时间和 CPU,主要是因为有时生成的进程会卡住并将 CPU 固定在 99%。 nice 和 ulim
我一直在使用 subprocess.check_output()有一段时间从子进程捕获输出,但在某些情况下遇到了一些性能问题。我在 RHEL6 机器上运行它。 调用 Python 环境是 linux
我想从 python 运行一个程序并找到它的内存使用情况。为此,我正在使用: l=['./a.out','','out.txt'] p=subprocess.Popen(l,shell=False,s
我正在使用 Python 2.7 我正在尝试从 Python 运行 StatTransfer 程序。 当我尝试时: tempname = os.path.abspath('./text.txt') T
我想执行以下操作: 使用 subprocess.check_call 从 Python 外壳到另一个可执行文件 捕获子进程的 stderr(如果有) 将 stderr 输出添加到父进程的 Called
我编写了一个程序(myProg.py),它使用subprocess模块通过run函数运行其他python程序。我注意到这些其他 python 程序中的 input(arg) 语句中的 arg 没有
我有这个小脚本可以让您的无线设备进入监控模式。它执行 airodump 扫描,然后在终止扫描后将输出转储到 file.txt 或变量,这样我就可以抓取 BSSID 和我可能需要的任何其他信息。 我觉得
我最近在 Python 中注意到 subprocess.Popen() 有一个参数: stdout=None(default) 我还看到有人使用 stdout=subprocess.PIPE。 有什么
我已经查看了它们的文档。 这个问题是由 J.F. 在这里的评论提示的:Retrieving the output of subprocess.call() subprocess.call() 的当前
我一直在尝试了解 subprocess.call 和 subprocess.run 之间的区别。我知道最后一个是 Python 3.5 上的新版本,两者都基于 subprocess.Popen,但我还
我无法得到它与 bash 相关或 python 子进程,但结果不同: >>> subprocess.Popen("echo $HOME", shell=True, stdout=subprocess.
我正在编写一个需要在 Linux 和 Windows 上运行并使用路径中存在的可执行文件(带参数)的程序。 (假设) 目前,我在使用 Subprocess.Call 和 Subprocess.Pope
当我的脚本有 .pyw扩展,函数 subprocess.Popen不起作用,但如果我使用 .py扩展,它的工作原理。其实扩展并不是那么重要,关键是我是否使用终端来运行脚本,如果我不使用它我有问题,否则
我是一名优秀的程序员,十分优秀!