gpt4 book ai didi

bash - 删除冗余数据

转载 作者:行者123 更新时间:2023-11-29 09:37:12 24 4
gpt4 key购买 nike

我有一个看起来像这样的文件(3 列和 n 行)

chr8    101999980   102031975
chr8 101999980 102033533
chr8 101999980 102033533
chr8 101999980 102032736
chr8 101999980 102034799
chr8 101999980 102034799
chr8 101999980 102034397
chr8 101999980 102032736

我想从这些数据中删除多余的行,这些精确的重复数据可以使用 bash 脚本出现在这个数据集中的任何地方。

最佳答案

如果维持秩序很重要:

awk '!c[$0]++' filename

这可以理解为:

  • 将每一行作为数组键推送 (c[$0]),
  • post-increments (++) 值以保持对此类行的计数,以及
  • 仅当该行以前从未见过时才执行默认操作 (!)
    • n++ 如果 n 未设置则返回 0 或 false
    • 默认操作是{print}

关于bash - 删除冗余数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6830775/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com