gpt4 book ai didi

linux - 将适配器序列添加到 fastq 文件的末尾

转载 作者:太空宇宙 更新时间:2023-11-04 03:36:25 25 4
gpt4 key购买 nike

我有一个很大的 fastq 文件,我想将序列“TTAAGG”添加到文件中每个序列的末尾(第 2 行,然后每第 4 行),同时仍然保持 fastq 文件格式。例如:这是我开始的第一行:

@HWI-D00449:41:C2H8BACXX:5:1101:1219:2053 1:N:0:
GCAATATCCTTCAACTA
+
FFFHFHGFHAGGIIIII

我希望它打印出来:

@HWI-D00449:41:C2H8BACXX:5:1101:1219:2053 1:N:0:
GCAATATCCTTCAACTATTAAGG
+
FFFHFHGFHAGGIIIII

我想 sed 或 awk 会对此很有帮助,但我一直无法找到允许我保留 fastq 格式的解决方案。

我尝试过:

awk 'NR%4==2 { print $0 "TTAAGG"}' < file_in.fastq > fileout_fastq 

它将 TTAAGG 添加到第二行,然后每第四行添加一次,但也删除了其他三行。

有人对我可以使用的命令行有建议吗?或者如果您知道当前可用的软件包可以做到这一点,请告诉我!

最佳答案

使用 GNU sed 尝试一下:

 sed '2~4s/$/TTAAGG/' file

关于linux - 将适配器序列添加到 fastq 文件的末尾,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31413370/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com