gpt4 book ai didi

unix - 查找在同一行中多次出现某种模式的文件

转载 作者:行者123 更新时间:2023-12-02 06:12:58 25 4
gpt4 key购买 nike

我有一个 fasta 格式的文件,如下例所示。当序列:'CGTACG' 出现不止一次时,我想从该文件中提取条目。

>seq1
AAATTCCGTACGGGCCTCT
>seq2
TGGAATCACAGCGGCGTACGCAGCGGCGGCTGCGGCCGTACGGCG
>seq3
AATGCCAAACGTACGAACAT

在示例中,输出将是(因为序列“CGTACG”出现了两次):

>seq2
TGGAATCACAGCGGCGTACGCAGCGGCGGCTGCGGCCGTACGGCG

最佳答案

您只需要:

awk '/^>/{seq=$0} gsub(/CGTACG/,"&") > 1{print seq ORS $0}' file

关于unix - 查找在同一行中多次出现某种模式的文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59688190/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com