gpt4 book ai didi

perl - grep,根据 id 行中的单词从 fasta 文件中提取序列子集

转载 作者:行者123 更新时间:2023-12-05 01:04:57 26 4
gpt4 key购买 nike

我知道有类似的问题,但这个略有不同。我想根据 id 行中的单词从 fasta 文件中提取序列子集,并将找到的序列放入新文件中。我试过了

grep -E 'Eukaryota' test_db.fasta > new.fa

但这只给了我包含这个词的标识符行。我也需要序列。序列的长度不同。

关于如何更改我的命令或 Perl 解决方案的任何想法?

谢谢

最佳答案

试试这个简单的 Awk 单行代码。

awk '/^>/ { p = ($0 ~ /Eukaryota/)} p' test_db.fasta>new.fa

这会在任何以 > 开头的行中查找“Eukaryota”。如果找到,则将 p 设置为 1,否则设置为 0。如果 p 非零,则打印该行。

关于perl - grep,根据 id 行中的单词从 fasta 文件中提取序列子集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28070734/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com