- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我想在我的 Python 脚本中添加一个 bash 命令,它线性化 FASTA 序列文件,同时保持序列分离不变(因此选择了特定的命令)。以下是命令,示例输入文件为“inputfile.txt”:
awk '/^>/ {printf("\n%s\n",$0);next; } { printf("%s",$0);} END {printf("\n");}' < inputfile.txt
目的是让用户在命令行中指定要修改的文件,例如:
$ python3 program.py inputfile.txt
我尝试将字符串格式(即 %s
)与 sys.argv
结合使用以实现此目的。但是,我已经尝试了 "
和 '
的许多不同位置,但仍然无法使其正常工作并从此处的命令行接受用户输入。(该命令包含诸如 \n
之类的转义符,因此我试图通过添加额外的反斜杠以及现有 %s< 的额外
在命令中。)%
来抵消这种情况
import sys
import subprocess
path = sys.argv[1]
holder = subprocess.Popen("""awk '/^>/ {printf("\\n%%s\\n",$0);next; } { printf("%%s",$0);} END {printf("\\n");}' < %s""" % path , shell=True, stdout=subprocess.PIPE).stdout.read()
print(holder)
如果您能帮助我识别此处的语法错误,或就如何添加此用户输入提出建议,我将不胜感激。
最佳答案
TL;DR:不要花钱买 awk!只需使用 Python。但是让我们一步一步来......
您在这里使用三重引号的直觉很好,那么至少您不需要同时转义单引号和双引号,这是您在 shell 字符串中需要的。
您可以使用的下一个有用的设备是原始字符串,使用 r'...'
或 r"..."
或 r"""..."""
。原始字符串不会扩展反斜杠转义符,因此在这种情况下您可以保持 \n
不变。
最后是 %s
,如果你使用 %
运算符,你需要转义它,但在这里我建议不要使用 shell 来重定向输入,只需使用 Python 的子进程从文件发送标准输入!简单得多,你最终没有替代品。
我还建议您使用 subprocess.check_output()
而不是 Popen()
。它使用起来更简单,也更健壮,因为它将检查命令是否成功退出(退出状态为零)。
将所有这些放在一起(到目前为止),您会得到:
with open(path) as inputfile:
holder = subprocess.check_output(
r"""awk '/^>/ {printf("\n%s\n",$0);next; } { printf("%s",$0);} END {printf("\n");}'""",
shell=True,
stdin=inputfile)
但是在这里你可以更进一步,因为你真的不再需要 shell,它只是用于将命令行拆分为两个参数,所以只需在 Python 中进行拆分(这几乎总是可能且容易的这样做并且它更加健壮,因为您不必处理 shell 的分词!)
with open(path) as inputfile:
holder = subprocess.check_output(
['awk', r'/^>/ {printf("\n%s\n",$0);next; } { printf("%s",$0);} END {printf("\n");}'],
stdin=inputfile)
列表中的第二个字符串仍然是原始字符串,因为您想保留 bacsklash 转义。
我可以探讨如何在 awk 中不使用 printf()
而是使用 print
来做到这一点,这应该摆脱 \n
s 和 %
s,但我会告诉你,直接用 Python 做你正在做的事情要容易得多!
事实上,awk(或 sed、tr、cut 等)可以做的所有事情,Python 都可以做得更好(或者,至少以一种更具可读性和可维护性的方式。)
对于您的特定代码:
with open(path) as inputfile:
for line in inputfile:
if line.startswith('>'):
# Insert a blank line before this one.
print()
print(line)
if line.startswith('>'):
# Also insert a blank line after this.
print()
# And a blank line at the end.
print()
这不是更好吗?
您可以将它放入一个函数、一个模块中,然后在任何您喜欢的地方重复使用它。很容易将结果存储在一个字符串中,如果你愿意,可以将它保存到一个变量中,更加灵活......
无论如何,如果您仍然想坚持 shelling out,请参阅我之前的代码,我认为这是您在仍然 shelling out 的同时可以做的最好的事情,而无需显着更改外部命令。
关于python - 如何将字符串格式应用于 bash 命令(通过子进程合并到 Python 脚本中)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57463917/
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 9 年前。 Improve this
我有一系列 SQL 命令,我想在大约 40 个不同的表上运行。必须有一种方法可以在不编写 40 条不同命令的情况下执行此操作... 我在 SQL Server 中运行它。所有表都有不同的名称,我要操作
我习惯在 PHP 中使用命令“mysql_insert_id()”来返回插入到我的数据库中的最后一行的 id。 在 C# 中的 SQLite 中是否有等效的命令? 谢谢! -阿德娜 最佳答案 选择 l
试图找出一种方法来回填 ds 分区 Hive 表的分区。 我知道如何从 CLI 运行 Hive 命令,例如 $HIVE_HOME/bin/hive -e 'select a.col from tab1
我有 .bat 文件。看起来像下一个 ....many commands1 ftp -i -s:copy.txt ...many commands2 copy.txt 包含下一个命令 open ...
基本上我想输入 show 并检查是否有 show 命令或别名已定义并触发它,如果未定义则触发 git show 。 例如 rm 应该执行 rm 但 checkout 应该执行 git checkout
我公司的主数据库是 iSeries 机器,我已经非常习惯使用 DB2 命令和结构。我现在正在尝试做一个小项目,更新一个包含超过 300 万条记录的表。我想出一种比较和“清理”数据的更快方法是使用 My
我想在带有 Node 的终端中制作一个简单的按钮板,并“blessed”用于连接或运行不同的命令。 ----------------------------------------------- _
我们有一个 selenium IDE 脚本,正在转换为 python webdriver。以下命令未转换: [openWindow | http://mywebsite.com/index.php |
我正在学习这个关于从 GIT HUB 下载和安装 Web 文件的在线教程。我进入主题:启动我们的静态网站,系统提示我输入命令以下载和安装 Web 文件。但是,当我输入命令 yarn install 时
我在 shell 脚本中使用 elif 命令时遇到问题,就像在 fortran 中一样。 我有 100 家公司的员工名单。我想屏蔽那些员工少于 500 人的公司。我的脚本是 rm -f categor
我有一些 Linux 命令可以生成 token 。我在 Linux 机器上使用操作系统库形式的 Python 自动化了这些命令。它工作正常。 但是,当我在 Windows 中尝试相同的代码时,它没有返
本文分享自华为云社区《Git你有可能不知道交互式暂存》,作者:龙哥手记。 本节中的几个交互式 Git 命令可以帮助你将文件的特定部分组合成提交。 当你在修改了大量文件后,希望这些改动能拆分为若干提交而
我想知道如何使用 IN 比较语法来做到这一点。 当前的 SQL 查询是: select * from employee where (employeeName = 'AJAY' and month(e
我在这个位置安装了 Hadoop /usr/local/hadoop$ 现在我想列出 dfs 中的文件。我使用的命令是: hduser@ubuntu:/usr/local/hadoop$ bin/ha
是否有一个单一的 docker 命令可用于清除所有内容?如果正在运行,请停止所有容器、删除所有图像、删除所有卷...等。 最佳答案 我认为没有一个命令可以做到这一点。您首先需要停止所有容器使用 $ d
我基本上是在 clojure/nrepl 模式中寻找与 C-u C-x C-e 或 C-c C-p 等效的 Scheme。 我想要一个 C-x C-e 将输出打印到缓冲区,而不是仅仅在 repl 中。
我可以在 vim 中使用 pudb(一个 ncurses Python 调试器),因为,例如,:!python %在实际的终端窗口中运行。我更喜欢使用 gvim,但 gvim 运行 :!python
我正在尝试编写一个 FFMPEG 命令: 取为 输入 一个视频 input.mp4 和一个图像 pic.jpg 作为 输出 将 input.mp4 拆分为 20 秒的视频,按顺序重命名;对于每个分割视
我想转储视频每帧的比特率。我正在尝试使用 -vstats 获取此信息命令。当我运行此命令时 - ffmpeg -i input.mp4 -vstats 它显示至少应该定义一个文件。 如果有人能建议我任
我是一名优秀的程序员,十分优秀!