gpt4 book ai didi

linux - 从多列文件中提取行

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:06:54 25 4
gpt4 key购买 nike

我有以下格式的数据集:

Identified_____ID#2357_____ReadSequence:1238  
Unknown_____0_____ReadSequence:0979
Unknown_____0_____ReadSequence:5476
Identified_____ID#567899_____ReadSequence:4376

使用 awk 命令,如何提取 ReadSequences 但仅提取已识别的行(基于第一列条目)?

最佳答案

$ awk -F"_____" '$1=="Identified" {print $3}' test.in 
ReadSequence:1238
ReadSequence:4376

如果您只想要 ReadSequence id,gsub 是您的 friend :

$ awk -F"_____" '$1=="Identified" {gsub(/^.*:/,"",$3); print $3}' test.in 
1238
4376

关于linux - 从多列文件中提取行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38476272/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com