gpt4 book ai didi

bash - 如何在 awk 中用 "."替换重复的行?

转载 作者:行者123 更新时间:2023-11-29 09:17:29 26 4
gpt4 key购买 nike

我需要用“.”替换第一列中的重复项

例如:

name1
name1
name1
name2
name2
name3
name3

我需要输出:

name1
.
.
name2
.
name3
.

我有这样的解决方案:

awk '{c=$1} c==p{gsub(/./,".",$1)} {p=c} 1' in.file

但是输出是:

name1
.....
.....
name2
.....
name3
.....

有没有不用其他管道的解决方案?

最佳答案

使用数组检查是否已经看到一行!

$ awk 'seen[$0]++ {$0="."}1' file
name1
.
.
name2
.
name3
.

跳过重复行的典型方法是说 awk '!seen[$0]++' file。这里我们使用相同的逻辑,但稍微扭曲了一点:我们使用数组 seen[] 来检查到目前为止是否出现了一行。如果有,seen[$0]++ 将大于 0,因此将出现 {$0="."}。然后,1 打印此行或此行。

如果您碰巧需要它来检查定义的列而不是整行,请将 $0(完整记录)替换为 $n,其中 n 是第 n 字段。

关于bash - 如何在 awk 中用 "."替换重复的行?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38853674/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com