sed 配方 : how to do stuff between two patterns that can be either on one line or on two lines?-6ren

sed 配方 : how to do stuff between two patterns that can be either on one line or on two lines?

转载作者：行者123 更新时间：2023-12-04 19:29:04

25

4

假设我们只想在某些模式之间进行一些替换，让它们成为 <a>和 </a>为清楚起见...(好吧，好吧，它们是 start 和 end !.. Jeez!)

所以我知道如果 start 该怎么办和 end总是出现在同一行:只需设计一个合适的正则表达式即可。

如果保证它们在不同的行上并且我不关心包含 end 的行中的任何内容，我也知道该怎么做我也可以在包含 start 的行中应用所有命令之前 start : 只需将地址范围指定为 /start/,/end/ .

然而，这听起来不是很有用。如果我需要做一个更聪明的工作，例如，在 {...} 中引入变化怎么办？阻止？

我能想到的一件事是打破 { 上的输入和 }在处理和之后将其放回原处之前:

sed 's/{\|}/\n/g' input | sed 'main stuff' | sed ':a $!{N;ba}; s/\n\(}\|{\)\n/\1/g'

另一种选择是相反的:

cat input | tr '\n' '#' | sed 'whatever; s/#/\n/g'

这两个都很丑陋，主要是因为操作不局限于单个命令。第二个更糟糕，因为必须使用某些字符或子字符串作为“换行符”，假设它不存在于原始文本中。

那么问题来了:有没有更好的方法或者上面说的可以优化？从我最近阅读的 SO 问题来看，这是一项非常常规的任务，因此我想一劳永逸地选择最佳实践。

附言我最感兴趣的是纯 sed解决方案:是否可以通过一次调用 sed 来完成这项工作？没有别的吗？请不要 awk , Perl等:这更像是一个理论问题，而不是“需要尽快完成工作”的问题。

最佳答案

这可能对你有用:

# create multiline test data
cat <<\! >/tmp/a
> this
> this { this needs
> changing to
> that } that
> that
> !
sed '/{/!b;:a;/}/!{$q;N;ba};h;s/[^{]*{//;s/}.*//;s/this\|that/\U&/g;x;G;s/{[^}]*}\([^\n]*\)\n\(.*\)/{\2}\1/' /tmp/a
this
this { THIS needs
changing to
THAT } that
that
# convert multiline test data to a single line
tr '\n' ' ' </tmp/a >/tmp/b
sed '/{/!b;:a;/}/!{$q;N;ba};h;s/[^{]*{//;s/}.*//;s/this\|that/\U&/g;x;G;s/{[^}]*}\([^\n]*\)\n\(.*\)/{\2}\1/' /tmp/b
this this { THIS needs changing to THAT } that that

解释:

将数据读入模式空间(PS)。 /{/!b;:a;/}/!{$q;N;ba}
将数据复制到保留空间 (HS)。 h
从字符串的前后剥离非数据。 s/[^{]*{//;s/}.*//
转换数据，例如s/this\|that/\U&/g
交换到 HS 并附加转换后的数据。 x;G
用转换后的数据替换旧数据。s/{[^}]*}$[^\n]*$\n$.*$/{\2}\1/

编辑:

一个更复杂的答案，我认为它可以满足每行不止一个 block 的需要。

# slurp file into pattern space (PS)
:a
$! {
N
ba
}
# check for presence of \v if so quit with exit value 1
/\v/q1
# replace original newlines with \v's
y/\n/\v/
# append a newline to PS as a delimiter
G
# copy PS to hold space (HS)
h
# starting from right to left delete everything but blocks
:b
s/\(.*\)\({.*}\).*\n/\1\n\2/
tb
# delete any non-block details form the start of the file
s/.*\n//
# PS contains only block details
# do any block processing here e.g. uppercase this and that
s/th\(is\|at\)/\U&/g
# append ps to hs
H
# swap to HS
x
# replace each original block with its processed one from right to left
:c
s/\(.*\){.*}\(.*\)\n\n\(.*\)\({.*}\)/\1\n\n\4\2\3/
tc
# delete newlines
s/\n//g
# restore original newlines
y/\v/\n/
# done!

注意这使用 GNU 特定选项，但可以进行调整以与通用 sed 一起使用。

关于sed 配方 : how to do stuff between two patterns that can be either on one line or on two lines?，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/11024245/

25

4

0

文章推荐： sql - 获取 ORACLE 编程对象定义

文章推荐： r - 如何根据数据框中的位置用数字替换字符串？

文章推荐： caching - 删除重复缓存文件夹是否安全？

文章推荐： autohotkey - 命令后的逗号有什么作用？

Java 8 流 : How to read lines between two lines specified by line content
当前问题陈述的输入是 - 输入.txt #START_OF_TEST_CASES #DATA key1:VA1 key2:VA2 key3:VA3 key4:VA4 key5:VA5 #DEND #E
php - 注意 : . .. Unknown on line 0 - How to find correct line, it's NOT "line 0"
编辑:添加了 PDO 调用。这是实际的错误: Notice: Object of class PDOStatement could not be converted to int in Unknow
git - 有没有办法让 git show lines added, lines changed and lines removed？
“git diff --stat”和“git log --stat”显示如下输出: $ git diff -C --stat HEAD c9af3e6136e8aec1f79368c2a6164e56
java - 将 Files.lines 与 .map(line -> line.split ("multiple delimiters")) 一起使用
我有一个具有以下格式的输入文件:安大略省:布兰普顿:北纬 43° 41':西经 79° 45'安大略省:多伦多:北纬 43° 39':西经 79° 23'魁北克省:蒙特利尔:北纬 45° 30':西经
python - 为什么 line != "\n"或 line != "\r\n"或 line ! ="\r"无法过滤空行？
空白行仅包含\n或\r\n或\r。 tempfile = open(file,"r") for id,line in enumerate(tempfile): if(line != "\n"
lines - 如何去除 BABYLON Lines 上的光效
我尝试使用 BABYLON.js 开发棋盘游戏我有一个板子和一个 ArcRotateCamera。我的灯是 HemisphericLight 当我在板上画线时，我希望这些线具有相同的外观。现在，当我
lines - 如何去除 BABYLON Lines 上的光效
我尝试使用 BABYLON.js 开发棋盘游戏我有一个板子和一个 ArcRotateCamera。我的灯是 HemisphericLight 当我在板上画线时，我希望这些线具有相同的外观。现在，当我
linux - "$line"和 "^$line"有什么区别
有一个while read循环: while read line; do grep "^$line" file1 done < target 我应该使用 "^$line" 来获得正确答案。我想
python : How to fill an array line by line?
我有一个我无法解决的 numpy 问题。我有填充 0 和 1 的 3D 数组 (x,y,z)。例如，z 轴上的一个切片: array([[1, 0, 1, 0, 1, 1, 0, 0],
javascript - 如何迭代 "line-by-line"npm 中的所有行？
作为临时方法，我使用 .txt 文件来存储程序的某些变量。写入与 fs.appendFile 完美配合，但考虑到它的大小，使用 fs.readFile 读取不合适 - 我想得到某一行来自文件，以及
rstudio - R-调试: line by line through a loop
我试图找到一种通过R studio进行调试的方法，但是我发现的所有解决方案都无法真正起作用。 1.)CTRL + enter:有效，但不会通过循环的每次迭代，而只能执行一次。 2.)添加“browse
java - 安卓开发: Line Spacing With Line Numbering
在我的应用程序中，我的 EditText 左侧有行号 - 到目前为止一切都很好，行号与 EditText 的行完全对齐。问题是，如果用户更改 EditText 的文本大小，则行号无法正确对齐。所以我
command-line - Vim : from command line, 转到文件末尾并开始编辑？
通过使用 + 的参数调用它，我可以使 vim 将光标定位在文件的最后一行。 : vi + myfile # "+" = go to last line of file 我怎样才能做到
克洛尤尔 : Read an edn file line by line
我已经在文件中写入了这样的数据(某种) {:a 25 :b 28} {:a 2 :b 50} ... 我想要这些 map 的惰性序列。大约有 4000 万行。我也可以写 10000 的 block
javascript - 多行文本区域值 : line feed not present in all lines
我在文本区域中发现了一个奇怪的错误(？)... 比如说，有一个使用多行文本(用户粘贴的文本或预设文本无关紧要，两者都经过测试)。我想从中获取文本并替换 \n与其他东西......结果是，.re
python - Reportlab new line in a long line
我需要一个新行，这样我就可以在 PFD 中看到一个格式，我尝试添加一个页面宽度但它没有用，我用另一个东西/n 也没有用。这是我的代码。我可以手动添加格式，因为我需要显示从数据库中获取的信息，并且我在一
Java地理工具: Snap to line identifiying line that was snapped to
我正在尝试编写一个 Java 程序，它将大量 GPS 坐标捕捉到线形文件(道路网络)，并且不仅返回新坐标，还返回捕捉到的线段的唯一标识符。该标识符是否是 FID、其他语言中使用的“索引”(即，其中 1
javascript - 填充二维数组 "line by line"JavaScript/NodeJS
你好，我正在努力处理 JavaScript/NodeJS 中的数组。基本上，这是我的代码: let arr = new Array(); arr = { "Username" : var1,
python - matplotlib 2d line line,=plot逗号意思
我正在学习 matplotlib 的基本教程，我正在处理的示例代码是: import numpy as np import matplotlib.pylab as plt x=[1,2,3,4] y=
c# - 文本文件 : Reading line by line C#
所以，假设我有一个包含 20 行的文本文件，每行都有不同的文本。我希望能够有一个包含第一行的字符串，但是当我执行 NextLine(); 时我希望它成为下一行。我试过了，但它似乎不起作用: strin

首页

博学

6Ren·AI

商城

sed 配方 : how to do stuff between two patterns that can be either on one line or on two lines?