gpt4 book ai didi

linux - 使用 awk 或 sed 从多个文件中消除重复行

转载 作者:塔克拉玛干 更新时间:2023-11-02 23:22:51 25 4
gpt4 key购买 nike

我想知道如何消除多个文件中的重复行。我使用这个命令来获取重复的行,但它只显示了共同的行:

sort *.txt | uniq -d | fgrep -f - *.txt | sort -t : -k 2

例如,如果我有以下文件:

文件1.txt:

AAA
BBB
CCC

文件2.txt:

AAA
EEE
FFF

文件3.txt:

BBB
ZZZ
...

文件20.txt:

AAA
BBB
TTT

我想要的结果是:

文件1.txt:

AAA
BBB
CCC

文件2.txt:

EEE
FFF

文件3.txt:

ZZZ
....

文件20.txt:

TTT

最佳答案

不要使用 uniq-d 标志。这将只显示重复的行。

来自 uniq --help:

-d, --repeated        only print duplicate lines, one for each group

相反,使用不带参数的 uniq:

sort *.txt | uniq | ...

或者,更简单地说,sort 可以为您统一化:

sort -u *.txt | ...

关于linux - 使用 awk 或 sed 从多个文件中消除重复行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32475236/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com