- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我有这样的字符串:
import a.b.c.d.f.Class1
import a.b.g.d.f.Class2
import a.b.h.d.f.Class3
import z.y.x.d.f.Class4
import z.y.x.d.f.Class5
import z.y.x.d.f.Class6
我想获取字符串第一部分的所有唯一出现。更具体地说,直到第三个时期。所以我这样做:
grep "import curam" -hr --include \*.java | sort | gawk -F "." '{print $1"."$2"."$3}' | uniq
这给了我:
import a.b.c
import a.b.g
import a.b.h
import z.y.x
但是,当第三个周期之前的字符串是唯一的时,我想获得第一次出现的完整字符串。所以,我想得到:
import a.b.c.d.f.Class1
import a.b.g.d.f.Class2
import a.b.h.d.f.Class3
import z.y.x.d.f.Class4
有什么想法吗?
最佳答案
只需跟踪唯一的第二个字段:
awk -F '[ .]' '!uniq[$2]++' file
也就是说,首先将字段分隔符设置为空格或点。这样,第二个字段始终是点分隔名称中的第一个单词:
$ awk -F '[ .]' '{print $2}' file
a
a
a
z
z
z
然后,只需检查它们何时首次出现:
$ awk -F '[ .]' '!uniq[$2]++' file
import a.b.c.d.f.Class1
import z.y.x.d.f.Class4
There are some subtle variations on the first three tokens between the String so I need to do just [.] Can't do space. I updated the question.
如果你有:
import a.b.c.d.f.Class1
import a.b.g.d.f.Class2
import a.b.h.d.f.Class3
import z.y.x.d.f.Class4
import z.y.x.d.f.Class5
import z.y.x.d.f.Class6
然后您需要拆分第二个 .
分隔字段并检查前三个切片何时重复。这可以使用与上述相同的方法来完成,只是使用 split()。然后使用前三个切片来检查唯一性:
$ awk '{split($2, a, ".")} !uniq[a[1] a[2] a[3]]++' file
import a.b.c.d.f.Class1
import a.b.g.d.f.Class2
import a.b.h.d.f.Class3
import z.y.x.d.f.Class4
关于linux - Uniq 但仅在字符串的一部分,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38655484/
我希望 uniq 命令的输出以逗号分隔,而不是: 30 hello 31 world 36 hey_there 142 i_am_bigest 我去拿: 30,h
我的数据为/tmp/1 9367543 9105616 9108177 8948074 8860323 9170406 9105616 我跑了,我什么也没得到 cat /tmp/1 | uniq -d
请看下面的内容我想要的只是从文件中获取 node_name 字符串并执行 uniq 以获取 uniq 字符串(如果它们相等) 但在下面的示例中,我有两条相等的线 (node_name moon1) 但
我知道它是排序的,并且输出用于找出文件中的唯一语句。我也觉得 uniq -u 应该打印文件中的每个唯一语句。 uniq -u data.txt 此语句的输出是: MsxcvOe3PGrt78wpZG2
所以我有一个非常简单的模型,叫做 Movies。我正在尝试添加一个类方法,该方法返回分配给数据库中电影的评级的整洁列表。看来我想调用 Movie.uniq.pluck(:rating) 所以我添加了这
我知道 & 会禁用原型(prototype),但括号也不会这样做。这两个代码块有什么不同,顶部不能像底部一样运行是否有原因, use List::Util; use constant FOO => (
我有一个名为“test.txt”的文件,如下所示: 10 10 10 8 10 9 10 10 9 10 8 由于某种原因,当我运行 uniq test.txt 时,我得到了以下输出: 10 8 10
//for a sorted array var iterator = function(value) { return value === 1; }; var numbers = [1, 2, 2,
我有三个表:Show、Episode 和 Character。每个节目都有_许多集和角色。 class Show 这几乎可行,但是某些节目有多个字符,因此在打印列表中,某些节目会多次列出。
我有很多 *.dat 文件。什么 bash 脚本可以删除每行中重复的相邻行? 最佳答案 你是说这样? #!/bin/bash for f in "$@" do cp "$f" /tmp/tmp.
我有一个包含以下示例数据的输入文件。 kernel_version 主机名 2.6.32-220.el6.x86_64 www01.dc1.domain.com 2.6.32-220.el6.x86_
1.gui Qxx 16 2.gu Qxy 23 3.guT QWS 18 4.gui Qxr 21 我想根据第 3 列中的值对文件进行排序,所以我使用: s
我有一个非常大的文本文件(即今天的 40 GB),我想过滤出唯一的行而不对文件进行排序。 文件有 unix 行结尾,所有内容匹配 [[:print:]]。我尝试了以下 awk 脚本来仅显示唯一的行:
尝试从 sam 文件中获取某个字段,对其进行排序,然后查找文件中唯一数字的数量。我一直在努力: cut -f 2 practice.sam > field2.txt | sort -o field2.
有一个包含 2 列的文件,仅需要在第 1 列上使用 uniq 并打印结果中的列以及出现次数(与-c)。 示例: 1 a1 a2 a3 c4 d2 1 a1 2 a1 3 c1 4 d 最佳答案 ech
这个问题在这里已经有了答案: Why does "uniq" count identical words as different? (4 个答案) 关闭 5 年前。 我在使用 unix uniq
我正在尝试学习如何使用终端命令 uniq。我正在使用 mac、bash shell (unix)。 这是我的文本文件“terminal.txt”: this is a line this is a
我有一个文件,我试图根据第四列进行排序,并根据该列删除重复的行。使用 sort -uk4,4 后,我的文件如下所示: chr1 76190472 76190502 NM_000016
我有这样的字符串: import a.b.c.d.f.Class1 import a.b.g.d.f.Class2 import a.b.h.d.f.Class3 import z.y.x.d.f.C
我有如下数据: 1493992429103289,207.55,207.5 1493992429103559,207.55,207.5 1493992429104353,207.55,207.5 14
我是一名优秀的程序员,十分优秀!