- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我试图在文件中查找那些行中的数字不在其前一行中的行。该文件大约有 400000 行。这是输入文件的示例:
320 5120
240 326 5120
240 326 5120
241 333 514
240 326 5120
240 326 5120
320 5120
240
100 112
240 326 5120
240 326 5120
320 5120
预期输出结果为:
241 333 514
240 326 5120
240
100 112
240 326 5120
到目前为止我可以找到这个命令:
$ awk '!seen[$1]++' file
320 5120
240 326 5120
241 333 514
100 112
我可以获得第 1 列的唯一编号,并且我可以对其他列单独执行相同的操作。我能以某种方式从这个命令中获取我想要的信息吗?任何帮助将不胜感激。
最佳答案
一个 Perl 命令行程序(“one”-liner),假设文件中除了数字之外的其他内容
perl -wnE'
@n = /([0-9]+)/g;
say "@n" if not grep { exists $seen_nums{$_} } @n;
%seen_nums = map { $_ => 1 } @n
' data.txt
这将打印所需的输出。它还打印第一行(正确)。由于该程序解析行中的数字,因此它可以用于带有标题、纯文本(注释?)行等的文件。
但是如果数据确定只有数字,那么我们可以使用 Perl 的 -a
switch @F
数组中每行上的单词都可用。还缩小了一点以实际适合一条线
perl -wlanE'grep exists $n{$_}, @F or say; %n = map { $_=>1 } @F' data.txt
开关的简要说明(请参阅上面链接的文档)
-w
打开警告
-l
去掉换行符,并可以将其重新粘上,还有一些微妙之处
-a
打开“自动分割”(与 -n
或 -p
一起使用时),以便 @F
在程序中可用,其中包含单词就行。在较新的 Perls 上,这也会设置 -n
-n
对于处理文件或 STDIN
至关重要 - 打开资源并设置行循环。使用-MO=Deparse
运行来看看它做了什么
-E
-e
使其将以下引号之间的所有内容计算为 Perl 代码。如果使用大写字母 (E
),它也会打开 feature s,我主要用于 say
。 (这样做有缺点,因为它启用了所有功能,并使事物不再向后兼容。)
注意:通过在打印中添加条件 $.!=2
可以省略第一行
关于bash - 查找前一行没有匹配数字的行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56487102/
前一段时间写过一篇文章《 实战,一个高扩展、可视化低代码前端,详实、完整 》,得到了很多朋友的关注。 其中的逻辑编排部分过于简略,不少朋友希望能写一些关于逻辑编排的内容,本文就详细讲述一下逻辑
我正在尝试以下 Java 片段: int[] testArray={10,20,30,40}; int i= 0; testArray[i++]= testArray[i++]+1; System.o
我想知道我是否可以通过某种方式在 C++ 中进行前/后函数调用。我有一个包含很多函数的包装器类,在每次调用包装器函数后,我应该调用另一个始终相同的函数。 所以我不想像这样对每个函数调用 postFun
我有一个像这样的头文件: #pragma once #include "gamestate.h" #include "ExitListener.h" class InitialGameState :
学习左值和右值。定义是任何可以是“地址”的东西都是左值,否则就是右值。 我检查了运算符的优先级,前缀和后缀增量都比“地址”运算符具有更高的优先级。 对于下面的两个例子,谁能解释一下为什么第一个“&++
在我的学习过程中,我遇到了前后迭代器,我想知道是否有办法让它们就地创建容器元素。从文档来看,容器似乎需要实现 push_back 函数才能与 back_iterator 一起使用。但是有没有一种方法可
我有两个关于 Java 中运算符优先级的类似问题。 第一个: int X = 10; System.out.println(X++ * ++X * X++); //it prints 1440 根据
请放轻松,不要对我开枪,因为我还是新手。 当我运行这段代码时,我完全糊涂了,终生无法弄清楚为什么: int y = 9; cout << "++y = " << ++y << "\n--y = " <
两种表达方式有区别吗: (*x)++ 和 ++(*x) 我可以看到这两个语句都替换了 *x 中 (*x+1) 的内容。但是它们之间有什么区别吗? 最佳答案 (*x)++ 计算为*x的值;作为副作用,*
我有一个如下所示的数据集: Date CONSUMER DISCR CONSUMER STAPLES ENERGY FINANCIALS HEALTH CARE
我希望检查名称字段中输入的前两个字符是否为字母 - 除此之外没有什么区别(空格、'、- 等都是公平的游戏)。这是我到目前为止所拥有的,但它不起作用。想法?谢谢! if (document.form01
我制作了一个简单的脚本,为像素和所有附近的像素着色为相同的颜色 Click foto
我需要编写一个循环,以下列格式输出从昨天算起的最近 30 天: 2014-02-02 2014-02-03 2014-02-04 ... 2014-03-04 我想我需要像这样使用循环: for ($
我正在做一些练习,但我对这个感到困惑: public static int f (int x, int y) { int b=y--; while (b>0) { if (x%2!=0
我需要一个 4 个字符的正则表达式。前 3 个字符必须是数字,最后 1 个字符必须是字母或数字。 我形成了这个,但它不起作用 ^([0-9]{3}+(([a-zA-Z]*)|([0-9]*)))?$
我需要编写一个循环,以下列格式输出从昨天算起的最近 30 天: 2014-02-02 2014-02-03 2014-02-04 ... 2014-03-04 我想我需要像这样使用循环: for ($
我有下面的程序,我试图找到前 1000 个素数的总和。在代码中,解决方案1和2有什么区别?为什么我不应该将 count 变量放在 if 条件之外?如果我把变量放在 if 之外,我显然没有得到我需要的答
这个问题在这里已经有了答案: Replace First N Occurrences in the String (7 个答案) 关闭 4 年前。 我有一个如下的字符串 const str = '_
我正在尝试测量以纳秒为单位的平均访问延迟,但在第一次迭代后我收到“段错误(核心转储)”。我错过了什么吗?我是否滥用了指针。这是导致错误的函数: #include #include #include
我有一个 SQL 问题 (MySQL)。我如何从下表创建一个新表(表名称:“well_master_prod_inj”)。 我需要按井名和日期聚合数据。我希望每个井名只有一行数据以及显示以下数据的列:
我是一名优秀的程序员,十分优秀!