linux - Uniq 但仅在字符串的一部分-6ren

linux - Uniq 但仅在字符串的一部分

转载作者：太空狗更新时间：2023-10-29 12:12:17

27

4

我有这样的字符串:

import a.b.c.d.f.Class1
import a.b.g.d.f.Class2
import a.b.h.d.f.Class3
import z.y.x.d.f.Class4
import z.y.x.d.f.Class5
import z.y.x.d.f.Class6

我想获取字符串第一部分的所有唯一出现。更具体地说，直到第三个时期。所以我这样做:

grep "import curam" -hr --include \*.java | sort | gawk -F "." '{print $1"."$2"."$3}' | uniq

这给了我:

  import a.b.c
  import a.b.g
  import a.b.h
  import z.y.x

但是，当第三个周期之前的字符串是唯一的时，我想获得第一次出现的完整字符串。所以，我想得到:

import a.b.c.d.f.Class1
import a.b.g.d.f.Class2
import a.b.h.d.f.Class3
import z.y.x.d.f.Class4

有什么想法吗？

最佳答案

只需跟踪唯一的第二个字段:

awk -F '[ .]' '!uniq[$2]++' file

也就是说，首先将字段分隔符设置为空格或点。这样，第二个字段始终是点分隔名称中的第一个单词:

$ awk -F '[ .]' '{print $2}' file
a
a
a
z
z
z

然后，只需检查它们何时首次出现:

$ awk -F '[ .]' '!uniq[$2]++' file
import a.b.c.d.f.Class1
import z.y.x.d.f.Class4

There are some subtle variations on the first three tokens between the String so I need to do just [.] Can't do space. I updated the question.

如果你有:

import a.b.c.d.f.Class1
import a.b.g.d.f.Class2
import a.b.h.d.f.Class3
import z.y.x.d.f.Class4
import z.y.x.d.f.Class5
import z.y.x.d.f.Class6

然后您需要拆分第二个 . 分隔字段并检查前三个切片何时重复。这可以使用与上述相同的方法来完成，只是使用 split()。然后使用前三个切片来检查唯一性:

$ awk '{split($2, a, ".")} !uniq[a[1] a[2] a[3]]++' file
import a.b.c.d.f.Class1
import a.b.g.d.f.Class2
import a.b.h.d.f.Class3
import z.y.x.d.f.Class4

关于linux - Uniq 但仅在字符串的一部分，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/38655484/

27

4

0

文章推荐： html - Bootstrap 卡片不像示例中那样显示

文章推荐： HTML 表格 - 固定宽度的列和水平滚动

文章推荐： css - 下拉菜单隐藏在 IE 中的其他元素后面

uniq - 更改 uniq 命令的分隔符
我希望 uniq 命令的输出以逗号分隔，而不是: 30 hello 31 world 36 hey_there 142 i_am_bigest 我去拿: 30,h
uniq - 通过 `uniq -d` 查找重复匹配项
我的数据为/tmp/1 9367543 9105616 9108177 8948074 8860323 9170406 9105616 我跑了，我什么也没得到 cat /tmp/1 | uniq -d
bash - uniq + 不从文件中获取 uniq 字符串
请看下面的内容我想要的只是从文件中获取 node_name 字符串并执行 uniq 以获取 uniq 字符串(如果它们相等) 但在下面的示例中，我有两条相等的线 (node_name moon1) 但
linux - 排序 data.txt | 有什么区别？ uniq -q 和 'uniq -q' ？
我知道它是排序的，并且输出用于找出文件中的唯一语句。我也觉得 uniq -u 应该打印文件中的每个唯一语句。 uniq -u data.txt 此语句的输出是: MsxcvOe3PGrt78wpZG2
ruby-on-rails - RoR ActiveRecord::Base uniq 在尝试 uniq.pluck(:column_name) 时未定义
所以我有一个非常简单的模型，叫做 Movies。我正在尝试添加一个类方法，该方法返回分配给数据库中电影的评级的整洁列表。看来我想调用 Movie.uniq.pluck(:rating) 所以我添加了这
perl - 为什么 `sort List::Util::uniq(BAR, BAZ);` 与 `sort &List::Util::uniq(BAR, BAZ);` 不同
我知道 & 会禁用原型(prototype)，但括号也不会这样做。这两个代码块有什么不同，顶部不能像底部一样运行是否有原因， use List::Util; use constant FOO => (
macos - `uniq` 未按预期工作
我有一个名为“test.txt”的文件，如下所示: 10 10 10 8 10 9 10 10 9 10 8 由于某种原因，当我运行 uniq test.txt 时，我得到了以下输出: 10 8 10
javascript - 重写下划线_.uniq
//for a sorted array var iterator = function(value) { return value === 1; }; var numbers = [1, 2, 2,
mysql - 在嵌套连接表上调用 uniq
我有三个表:Show、Episode 和 Character。每个节目都有_许多集和角色。 class Show 这几乎可行，但是某些节目有多个字符，因此在打印列表中，某些节目会多次列出。
bash - Uniq 许多文件到位
我有很多 *.dat 文件。什么 bash 脚本可以删除每行中重复的相邻行？最佳答案你是说这样？ #!/bin/bash for f in "$@" do cp "$f" /tmp/tmp.
perl - uniq 主机名的内核版本
我有一个包含以下示例数据的输入文件。 kernel_version 主机名 2.6.32-220.el6.x86_64 www01.dc1.domain.com 2.6.32-220.el6.x86_
Bash-是否可以只对一行的一列使用 -uniq ？
1.gui Qxx 16 2.gu Qxy 23 3.guT QWS 18 4.gui Qxr 21 我想根据第 3 列中的值对文件进行排序，所以我使用: s
bash - `uniq` 没有对巨大的文本文件进行排序？
我有一个非常大的文本文件(即今天的 40 GB)，我想过滤出唯一的行而不对文件进行排序。文件有 unix 行结尾，所有内容匹配 [[:print:]]。我尝试了以下 awk 脚本来仅显示唯一的行:
linux - 流水线切割排序 uniq
尝试从 sam 文件中获取某个字段，对其进行排序，然后查找文件中唯一数字的数量。我一直在努力: cut -f 2 practice.sam > field2.txt | sort -o field2.
linux - Uniq 和计数
有一个包含 2 列的文件，仅需要在第 1 列上使用 uniq 并打印结果中的列以及出现次数(与-c)。示例: 1 a1 a2 a3 c4 d2 1 a1 2 a1 3 c1 4 d 最佳答案 ech
linux - uniq 命令未检测到重复行
这个问题在这里已经有了答案: Why does "uniq" count identical words as different? (4 个答案) 关闭 5 年前。我在使用 unix uniq
linux - uniq 终端命令不起作用？
我正在尝试学习如何使用终端命令 uniq。我正在使用 mac、bash shell (unix)。这是我的文本文件“terminal.txt”: this is a line this is a
linux - 排序和 Uniq
我有一个文件，我试图根据第四列进行排序，并根据该列删除重复的行。使用 sort -uk4,4 后，我的文件如下所示: chr1 76190472 76190502 NM_000016
linux - Uniq 但仅在字符串的一部分
我有这样的字符串: import a.b.c.d.f.Class1 import a.b.g.d.f.Class2 import a.b.h.d.f.Class3 import z.y.x.d.f.C
linux - Uniqing 基于字段子集的分隔文件
我有如下数据: 1493992429103289,207.55,207.5 1493992429103559,207.55,207.5 1493992429104353,207.55,207.5 14

首页

博学

6Ren·AI

商城

linux - Uniq 但仅在字符串的一部分