gpt4 book ai didi

linux - 在 .fa header id 之后插入连续数字

转载 作者:太空宇宙 更新时间:2023-11-04 05:20:48 24 4
gpt4 key购买 nike

我有一个大的 .fa 文件,其中包含多个合并的 fasta 文件。每个文件由标题行分隔并以“>”开头。这是一个例子:

>DPB1*04:01:01:01 [most similar sequence] for DPB1 in 3507009462

我想通过在每个 id 后面添加一个连续的整数来修改文件内的每个 header 。 id 是“>”之后、第一个空格之前的第一个字符序列。修改后的 header 如下所示:

>DPB1*04:01:01:011 [most similar sequence] for DPB1 in 3507009462

我发现一些代码用连续的数字替换 header ,但不知道如何将其插入 header ID 之后。

cat youFile.fa | perl -ane 'if(/\>/){$a++;print ">$a\n"}else{print;}' > youFile_new.fa

感谢您的帮助

最佳答案

$ perl -wpe 's/\s/++$i . " "/e if /^>/' input.fa

说明:

  1. 用计数器变量和单个空格替换第一次出现的空格...
  2. ...但仅当该行以 > 开头时
  3. 打印每一行(由于 -p 开关)

关于linux - 在 .fa header id 之后插入连续数字,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42097728/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com