gpt4 book ai didi

linux - 删除包含下一行子字符串的几乎重复项

转载 作者:塔克拉玛干 更新时间:2023-11-03 01:57:14 25 4
gpt4 key购买 nike

我需要知道一种删除行中重复字符串的方法,但让我解释一下,因为我已经使用过 uniq。在一个文件中,我得到这两行:

ANASI:A=4-63261950;
ANASI:A=4-63261950,ES=541;

字符串 4-63261950 在两行中都是重复的,但该行本身不同,只是该字符串在两行中相等。我只需要一种方法来处理整个文件并删除第一行,只留下带有 ANASI:A=4-63261950,ES=541; 的行。该文件将包含几行与此完全相同的场景。有没有办法用 sed 或其他东西做到这一点?

最佳答案

awk 来拯救...

假设你的分隔符和结构保持不变

sort file | awk -F"[;,]" '!a[$1]++'

会根据词序选择第一个 (, <;)

关于linux - 删除包含下一行子字符串的几乎重复项,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32445377/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com