- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我想在我的 Python 脚本中添加一个 bash 命令,它线性化 FASTA 序列文件,同时保持序列分离不变(因此选择了特定的命令)。以下是命令,示例输入文件为“inputfile.txt”:
awk '/^>/ {printf("\n%s\n",$0);next; } { printf("%s",$0);} END {printf("\n");}' < inputfile.txt
目的是让用户在命令行中指定要修改的文件,例如:
$ python3 program.py inputfile.txt
我尝试将字符串格式(即 %s
)与 sys.argv
结合使用以实现此目的。但是,我已经尝试了 "
和 '
的许多不同位置,但仍然无法使其正常工作并从此处的命令行接受用户输入。(该命令包含诸如 \n
之类的转义符,因此我试图通过添加额外的反斜杠以及现有 %s< 的额外
在命令中。)%
来抵消这种情况
import sys
import subprocess
path = sys.argv[1]
holder = subprocess.Popen("""awk '/^>/ {printf("\\n%%s\\n",$0);next; } { printf("%%s",$0);} END {printf("\\n");}' < %s""" % path , shell=True, stdout=subprocess.PIPE).stdout.read()
print(holder)
如果您能帮助我识别此处的语法错误,或就如何添加此用户输入提出建议,我将不胜感激。
最佳答案
TL;DR:不要花钱买 awk!只需使用 Python。但是让我们一步一步来......
您在这里使用三重引号的直觉很好,那么至少您不需要同时转义单引号和双引号,这是您在 shell 字符串中需要的。
您可以使用的下一个有用的设备是原始字符串,使用 r'...'
或 r"..."
或 r"""..."""
。原始字符串不会扩展反斜杠转义符,因此在这种情况下您可以保持 \n
不变。
最后是 %s
,如果你使用 %
运算符,你需要转义它,但在这里我建议不要使用 shell 来重定向输入,只需使用 Python 的子进程从文件发送标准输入!简单得多,你最终没有替代品。
我还建议您使用 subprocess.check_output()
而不是 Popen()
。它使用起来更简单,也更健壮,因为它将检查命令是否成功退出(退出状态为零)。
将所有这些放在一起(到目前为止),您会得到:
with open(path) as inputfile:
holder = subprocess.check_output(
r"""awk '/^>/ {printf("\n%s\n",$0);next; } { printf("%s",$0);} END {printf("\n");}'""",
shell=True,
stdin=inputfile)
但是在这里你可以更进一步,因为你真的不再需要 shell,它只是用于将命令行拆分为两个参数,所以只需在 Python 中进行拆分(这几乎总是可能且容易的这样做并且它更加健壮,因为您不必处理 shell 的分词!)
with open(path) as inputfile:
holder = subprocess.check_output(
['awk', r'/^>/ {printf("\n%s\n",$0);next; } { printf("%s",$0);} END {printf("\n");}'],
stdin=inputfile)
列表中的第二个字符串仍然是原始字符串,因为您想保留 bacsklash 转义。
我可以探讨如何在 awk 中不使用 printf()
而是使用 print
来做到这一点,这应该摆脱 \n
s 和 %
s,但我会告诉你,直接用 Python 做你正在做的事情要容易得多!
事实上,awk(或 sed、tr、cut 等)可以做的所有事情,Python 都可以做得更好(或者,至少以一种更具可读性和可维护性的方式。)
对于您的特定代码:
with open(path) as inputfile:
for line in inputfile:
if line.startswith('>'):
# Insert a blank line before this one.
print()
print(line)
if line.startswith('>'):
# Also insert a blank line after this.
print()
# And a blank line at the end.
print()
这不是更好吗?
您可以将它放入一个函数、一个模块中,然后在任何您喜欢的地方重复使用它。很容易将结果存储在一个字符串中,如果你愿意,可以将它保存到一个变量中,更加灵活......
无论如何,如果您仍然想坚持 shelling out,请参阅我之前的代码,我认为这是您在仍然 shelling out 的同时可以做的最好的事情,而无需显着更改外部命令。
关于python - 如何将字符串格式应用于 bash 命令(通过子进程合并到 Python 脚本中)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57463917/
我有这个 html 代码: HELLO WORLD! X V HELLO WORLD! X V 我想按 X(类关闭)将父 div 的高度更改为 20px 并显示 V(类打开),但在每个 d
在会计应用程序的许多不同实现中,有两种主要的数据库设计方法来保存日志和分类帐数据。 只保留 Journal 信息,然后 Ledger 只是 Journal 的一个 View (因为 journal 总
我想在另一个子里面有一个子, sub a { sub b { } } 我想为每次调用 sub b 创建一个新的 sub a 实例。有没有办法在 Perl 中做到这一点? 当我运行上面的
我有一些代码正在查找重复项并突出显示单元格: Private Sub cmdDups_Click() Dim Rng As Range Dim cel As Range Set Rng = ThisW
可能有一个简单的解决方案,但我很难过。 我有一个包含一个 ID 字段的主表。在两个可能的字段中有一个具有该 ID 的子表。想象一个由选手 A 和选手 B 组成的 double 队。Master 表将有
假设我有一个包含对象的数组: [ { "id": "5a97e047f826a0111b754beb", "name": "Hogwarts", "parentId": "
我正在尝试对 MySQL 数据库表执行一对父/子模型的批量插入,但似乎无法使用标准的 ActiveRecord 功能来完成。所以,我尝试了 activerecord-import gem,但它也不支持
我有一个带有多个子类的父抽象类。最终,我希望通过 GUI 中的进度条显示子类中完成的进度。 我目前所做的,我意识到这是行不通的,是在父类中声明为每个子类将覆盖的虚拟方法的事件方法定义。所以像: pub
是否可以通过键数组在对象中设置变量?例如我有这个对象: var obj = {'outer': {'inner': 'value'} }; 并希望设置由键数组选择的值: var keys = ['ou
我有一个名为 companies 的 MySQL 表,如下所示: +---------+-----------+-----------+ | id_comp | comp_name | id_pare
我正在尝试使用 sublime text 在 sublime text 上的 ionic 上打开我的第一个应用程序。它给了我一个“找不到命令”的错误。如何修复? 我试过这些命令: sudo rm -r
不好意思问,但我正在使用 webapp2,我正在设计一个解决方案,以便更容易定义路由 based on this google webapp2 route function .但这完全取决于能够在子级
我有代表树的数字字符串(我不知道是否有官方名称): 012323301212 上面的例子代表了 2 棵树。根用 0 表示。根的直接子代为“1”,“1”的直接子代为“2”,依此类推。我需要将它们分组到由
是否可以在当前 Activity 之上添加 Activity 。例如,假设我单击一个按钮,然后它将第二个 Activity 添加到当前 Activity 。而第二个 Activity 只覆盖了我当前
我很难思考如何为子资源建模。 以作者的书籍为例。你可以有 N 本书,每本书只有一位作者。 /books GET /books POST /books/id PUT /books/id DELETE 到
有人可以向我解释以下内容(python 2.7) 来自已解析文件的两个字符串数字: '410.9''410.9 '(注意尾随空格) A_LIST = ['410.9 '] '410.9' in '41
背景 在 PowerShell 中构建 hash table 是很常见的通过特定属性快速访问对象,例如以 LastName 为基础建立索引: $List = ConvertFrom-Csv @' I
我真的很难弄清楚如何调用嵌套 Polymer Web 组件的函数。 这是标记: rise-distribution组件有 canPlay我想从 rise-playlist
我写了一个小工具转储(以 dot 格式)一个项目的依赖关系图,其中所有位于同一目录中的文件都聚集在一个集群中。当我尝试生成包含相应图形的 pdf 时,dot开始哭: 命令 dot -Tpdf trim
给定一个 CODE ref,是否可以: 访问该 CODE ref 的解析树 通过指定 CODE ref 的解析树来创建一个新的 CODE ref,该解析树可以包含在 1 中返回的解析树的元素 通常我们
我是一名优秀的程序员,十分优秀!