gpt4 book ai didi

awk - 使用 Sed/Awk 提取该行的前三个唯一实例

转载 作者:行者123 更新时间:2023-12-01 07:43:53 25 4
gpt4 key购买 nike

我有一个包含 20000 个探针的列表,有没有办法使用 sed/awk 提取每个探针的前三行/出现次数?

Example of dataset:
Probe1 A GTTAGAGGAGGTGGAAGAGC
Probe1 B CTGAGGTCGGGACGGAGCAC
Probe1 C GATGTAGGCGGTTGGCGTGG
Probe1 D GTTGGCGAAGTCACATCTAG
Probe1 E CATGTCGCCGACTCCGTCGA
Probe1 F GTGATGTTCTGAGTACATAG

Probe3 A GATTGTAGGTTTCCTGCCAG
Probe3 L ACCCAGCCAGGGGAAAACCA
Probe3 Z GGAGATGTAGGCGGTTGGCG
Probe3 Y GGAGATGTAGGCCTTAAAAA
Probe3 D GATTGTAGGGGTCCTGCCAG

期望的输出:

Probe1 A  GTTAGAGGAGGTGGAAGAGC
Probe1 B CTGAGGTCGGGACGGAGCAC
Probe1 C GATGTAGGCGGTTGGCGTGG
Probe3 A GATTGTAGGTTTCCTGCCAG
Probe3 L ACCCAGCCAGGGGAAAACCA
Probe3 Z GGAGATGTAGGCGGTTGGCG

最佳答案

awk 来救援!

$ awk '++a[$1]<4' file

删除空行

$ awk '++a[$1]<4 && NF' file

关于awk - 使用 Sed/Awk 提取该行的前三个唯一实例,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40835284/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com