bash - 如何在 awk 中用 "."替换重复的行？-6ren

bash - 如何在 awk 中用 "."替换重复的行？

转载作者：行者123 更新时间：2023-11-29 09:17:29

我需要用“.”替换第一列中的重复项

例如:

name1
name1
name1
name2
name2
name3
name3

我需要输出:

name1
.
.
name2
.
name3
.

我有这样的解决方案:

awk '{c=$1} c==p{gsub(/./,".",$1)} {p=c} 1' in.file

但是输出是:

name1
.....
.....
name2
.....
name3
.....

有没有不用其他管道的解决方案？

最佳答案

使用数组检查是否已经看到一行!

$ awk 'seen[$0]++ {$0="."}1' file
name1
.
.
name2
.
name3
.

跳过重复行的典型方法是说 awk '!seen[$0]++' file。这里我们使用相同的逻辑，但稍微扭曲了一点:我们使用数组 seen[] 来检查到目前为止是否出现了一行。如果有，seen[$0]++ 将大于 0，因此将出现 {$0="."}。然后，1 打印此行或此行。

如果您碰巧需要它来检查定义的列而不是整行，请将 $0(完整记录)替换为 $n，其中 n 是第 n 字段。

关于bash - 如何在 awk 中用 "."替换重复的行？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/38853674/

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章