gpt4 book ai didi

Linux命令查找两个可比较的行

转载 作者:太空狗 更新时间:2023-10-29 11:37:39 25 4
gpt4 key购买 nike

我有以下排序顺序的数据(这里的数据按照第一个 v1,然后是 v2,然后是 v3,然后是 v4 排序):

v1=1    v2=8513481      v3=119330184    v4=0
v1=1 v2=8521383 v3=119330182 v4=0
v1=1 v2=10630231 v3=60529116 v4=18
v1=1 v2=60528877 v3=60529221 v4=17
v1=1 v2=90351079 v3=90351078 v4=20
v1=1 v2=271669588 v3=271669683 v4=101
v1=2 v2=8513481 v3=10583646 v4=0
v1=2 v2=10175437 v3=10175436 v4=0
v1=2 v2=10630231 v3=60528947 v4=17
v1=2 v2=10630231 v3=60529119 v4=18
v1=2 v2=10630232 v3=605291191 v4=18

现在我想找出 2 行的 v1 和 v2 相等的行。即在上面给出的数据中,我想找到以下形式的行:

 v1=2    v2=10630231     v3=60528947     v4=17
v1=2 v2=10630231 v3=60529119 v4=18

我知道如何在 python 中通过比较连续的行以及每当有匹配项输出该行时执行此操作。有没有一种简单的方法可以使用 sed 等 linux 命令来做同样的事情。我知道如何使用 sed 在给定两个值时查找单词,但我不知道如何在这种情况下使用 sed。非常感谢您的解释。

最佳答案

使用 awk 会更容易一些:

awk '{
lines[$1,$2]=(lines[$1,$2]?lines[$1,$2] RS $0:$0)
dups[$1,$2]++
}
END {
for(line in lines)
if(dups[line]>1) print lines[line]
}' file
v1=2 v2=10630231 v3=60528947 v4=17
v1=2 v2=10630231 v3=60529119 v4=18
  • 我们创建了两个数组。 linesdups
  • 当不止一次看到第一列和第二列时,我们增加计数。为此,我们使用 dups 数组。
  • 在我们的 lines 数组中,我们检查是否存储了第一列和第二列相同的行。如果我们有,我们将重复的行附加到它。
  • END block 中,我们遍历 lines 数组。如果在我们的 dups 数组中多次找到第一行和列,我们将打印这些行。

或者,如果您不想将整个文件保存在内存中,您可以执行以下操作(因为您声明您的数据已经排序):

awk '($1==c1 && $2==c2){print line RS $0}{line=$0;c1=$1;c2=$2}' file
  • 我们将变量 line 指定为整个当前行,将 c1 指定为第 1 列,将 c2 指定为第 2 列。
  • 如果当前行的第 1 列和第 2 列与前面的第 1 列和第 2 列相同,则打印上一行和当前行。

关于Linux命令查找两个可比较的行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23519353/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com