gpt4 book ai didi

awk - 仅保留文件中最新且基于两个字段重复的行

转载 作者:行者123 更新时间:2023-12-04 05:03:22 25 4
gpt4 key购买 nike

这与问题有关

  • awk - Remove line if field is duplicate
  • sed/awk + regex delete duplicate lines where first field matches (ip address)

  • 我有一个这样的文件:
    FOO,BAR,100,200,300
    BAZ,TAZ,500,600,800
    FOO,BAR,900,1000,1000
    HERE,THERE,1000,200,100
    FOO,BAR,100,10000,200
    BAZ,TAZ,100,40,500

    重复项由前两个字段确定。此外,更“最近”的记录(文件中较低/较高的行号)是应该保留的记录。

    什么是将输出的 awk 脚本:
    BAZ,TAZ,100,40,500
    FOO,BAR,100,10000,200
    HERE,THERE,1000,200,100

    输出顺序不是那么重要。

    awk 语法的解释会很棒。

    最佳答案

    这可能对您有用(tac 和 GNU 排序):

    tac file | sort -sut, -k1,2

    关于awk - 仅保留文件中最新且基于两个字段重复的行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15844569/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com