gpt4 book ai didi

sed - 如何使用sed重命名fasta文件头

转载 作者:行者123 更新时间:2023-12-05 08:43:49 25 4
gpt4 key购买 nike

我知道这很简单,但我做不到。我正在尝试使用 sed 和 evnet 重命名 header ,尽管 reg experssion 有效,但我无法重命名 fasta header 。这是一个小例子。我有一个类似下面的多序列 fasta 文件

>Bra000001
CTTATTTTCTCCTTCACCACCGTACCACAGAAAAAAACTGTGATTTTAAA
AGCCACATTTACTTCTTTTTTTGTTGGGTCTAAATGTTAAAATAACATGT
>Bra000002
TTTATGTAGTACTGGACTAATCGGGTAGGGAAACAATCTTGATTTAGCAA
TACAGTGTAATAACTAATAATCATATTCATATTCCATAAATCCAAATGTT

现在我只想像这样在 fasta header 的末尾添加“Brassica rapa”

>Bra000001 Brassica rapa
CTTATTTTCTCCTTCACCACCGTACCACAGAAAAAAACTGTGATTTTAAA
AGCCACATTTACTTCTTTTTTTGTTGGGTCTAAATGTTAAAATAACATGT
>Bra000002 Brassica rapa
TTTATGTAGTACTGGACTAATCGGGTAGGGAAACAATCTTGATTTAGCAA
TACAGTGTAATAACTAATAATCATATTCATATTCCATAAATCCAAATGTT

我这样做是为了让它发挥作用

grep ">" in.fa | sed 's/$/ Brassica rapa/' > out.fa

然而,这样做我只能更改标题,而不能更改序列信息。理想情况下,我既要更改标题又要保持序列不变。

最佳答案

您只能使用 使用其替换命令,检查该行是否以 > 字符开头,将整行分组并在末尾附加您的字符串,例如:

sed 's/^\(>.*\)$/\1 Brassica rapa/' infile

它产生:

>Bra000001 Brassica rapa
CTTATTTTCTCCTTCACCACCGTACCACAGAAAAAAACTGTGATTTTAAA
AGCCACATTTACTTCTTTTTTTGTTGGGTCTAAATGTTAAAATAACATGT
>Bra000002 Brassica rapa
TTTATGTAGTACTGGACTAATCGGGTAGGGAAACAATCTTGATTTAGCAA
TACAGTGTAATAACTAATAATCATATTCATATTCCATAAATCCAAATGTT

关于sed - 如何使用sed重命名fasta文件头,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23280240/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com