gpt4 book ai didi

regex - sed 头痛 : inserting lines upon singular matches in file (NOT per line)

转载 作者:行者123 更新时间:2023-11-29 09:27:57 26 4
gpt4 key购买 nike

经过八个多小时的搜索,我认输并为此创建了一个新问题。操作很简单,但我很难让它正常工作,似乎已经通过了所有其他解决方案。我需要两件事:

1.) 在整个文件中 PBS 的第一个匹配出现的行之前插入一行。它应该在整个文件中只发生一次。出于某种原因,我尝试过的每个解决方案最终都会为文件中的每个事件复制插入;我怀疑,因为 sed 是逐行跟踪的。

所以这需要发生。原始文件:

stuff here  
stuff here
PBS -N
PBS -V
stuff here

变成:

stuff here  
stuff here
**inserted line**
PBS -N
PBS -V
stuff here

2.) 在整个文件中“PBS”的最后匹配出现的行之后追加一行。和以前一样:它应该在整个文件中只发生一次。

所以这需要发生:

stuff here  
stuff here
PBS -N
PBS -V
stuff here

变成:

stuff here  
stuff here
PBS -N
PBS -V
**inserted line**
stuff here

我在网上看到的所有解决方案(此时我打开了大约 20 个选项卡)都表明这应该相对容易。我毫不羞愧地宣布 sed 在这一点上对我的自尊心造成了伤害...感谢任何可以提供帮助的人

最佳答案

这里有三种方法,两种使用 sed,一种使用 awk。

单独使用sed

在第一次出现之前插入一次

$ sed ':a;$!{N;ba}; s/PBS/inserted line\nPBS/' file
stuff here
stuff here
inserted line
PBS -N
PBS -V
stuff here

在最后一次出现后插入一次:

$ tac file | sed ':a;$!{N;ba}; s/PBS/inserted line\nPBS/' | tac
stuff here
stuff here
PBS -N
PBS -V
inserted line
stuff here

工作原理

  • :a;$!{N;ba};

    这会一次读入整个文件。 (如果整个文件非常大,您将需要查看其他方法之一。)

  • s/PBS/插入行\nPBS/

    这会执行替换。

  • tac

    通常,在我们读入整个文件之前,没有办法知道文件中最后一次出现的 PBS。但是,tac 颠倒了行的顺序。因此,最后的变成了最先的。

使用 awk

awk 的主要优势在于它允许轻松使用变量。在这里,我们创建了一个标志 f,在我们第一次出现 PBS 后将其设置为 true:

$ awk '/PBS/ && !f {print "inserted line"; f=1} 1'  file
stuff here
stuff here
inserted line
PBS -N
PBS -V
stuff here

要在最后一次出现之后插入,我们可以使用上面的 tac 解决方案。为了多样化,这种方法分两次读取文件。在第一次运行时,它会跟踪 PBS 的最后行号。第二,它打印需要打印的内容:

$ awk 'NR==FNR{if (/PBS/)n=FNR;next} 1{print} n==FNR {print "inserted line"}'  file file
stuff here
stuff here
PBS -N
PBS -V
inserted line
stuff here

这些 awk 解决方案一次处理一行文件。如果文件非常大,这有助于限制内存使用。

使用 grep 和 sed

另一种方法是使用 grep 告诉我们需要处理的行号。在第一次出现之前插入:

$ sed "$(grep -n PBS file | cut -d: -f1 | head -n1)"' s/PBS/inserted line\nPBS/' file
stuff here
stuff here
inserted line
PBS -N
PBS -V
stuff here

这会在最后一个之后插入:

$ sed  "$(grep -n PBS file | cut -d: -f1 | tail -n1)"' s/.*PBS.*/&\ninserted line/' file
stuff here
stuff here
PBS -N
PBS -V
inserted line
stuff here

这种方法不需要一次将整个文件读入内存。

关于regex - sed 头痛 : inserting lines upon singular matches in file (NOT per line),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29043690/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com