gpt4 book ai didi

linux - 如何使用 bash 从大文件中提取所有以特定字符开头的单词?

转载 作者:塔克拉玛干 更新时间:2023-11-03 01:44:56 25 4
gpt4 key购买 nike

我有一个非常大的文件,看起来像这样:

ENST00000629289"; transcript_version "2"; exon_number "22"; gene_name "CDK11B"; gene_source "ensembl_havana"; gene_biotype "protein_coding"; transcript_name "CDK11B-208"; transcript_source "ensembl"; transcript_biotype "protein_coding"; exon_id "ENSE00001594002"; exon_version "1"; tag "basic"; transcript_support_level "5";
ENST00000629289"; transcript_version "2"; exon_number "22"; gene_name "CDK11B"; gene_source "ensembl_havana"; gene_biotype "protein_coding"; transcript_name "CDK11B-208"; transcript_source "ensembl"; transcript_biotype "protein_coding"; exon_id "ENSE00001594002"; exon_version "1"; tag "basic"; transcript_support_level "5";
ENST00000629289"; transcript_version "2"; exon_number "22"; gene_name "CDK11B"; gene_source "ensembl_havana"; gene_biotype "protein_coding"; transcript_name "CDK11B-208"; transcript_source "ensembl"; transcript_biotype "protein_coding"; protein_id "ENSP00000485937"; protein_version "1"; tag "basic"; transcript_support_level "5";

我想提取所有以特定字符“ENST”开头的单词我尝试了以下命令:

 sed 's/.*\(ENST.*transcript_version\)/\1/p'

但它会打印出所有行。有人可以帮我解决这个问题吗?

最佳答案

使用grep-o 选项只打印匹配的部分:

grep -Po '^ENST.*transcript_version' file

关于linux - 如何使用 bash 从大文件中提取所有以特定字符开头的单词?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44666619/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com