gpt4 book ai didi

regex - 正则表达式 - Linux - 之间,但不包括

转载 作者:太空宇宙 更新时间:2023-11-04 11:54:40 25 4
gpt4 key购买 nike

我在 Linux ( CentOS ) 上,我正在尝试从看起来像的东西中捕获

 This, formatting | is, 123gh234ee2, {absolutely}, [ positively | obnoxious | in ], {every}, [ {single} | {way} ],, Thanks | For your | Help!

我想要的是替换所有管道 |,但只替换 [ ] 内的管道。所以……

 This, formatting | is, 123gh234ee2, {absolutely}, [ positively ; obnoxious ; in ], {every}, [ {single} ; {way} ],, Thanks | For your | Help!

我已经尝试了几种表达方式,但我认为应该起作用的那个却不起作用。谁能解释一下为什么?

sed -i 's/(?<=\[)(\|)(?=\])/;/g' 'myFile.txt'

我的想法是展望 future [ with

(?<=\[)

往后看

(?=\])

并捕获管道

(\|)

但是我的文件中没有任何变化,而且我似乎真的无法指出哪里出了问题。

谢谢!

为了澄清,我还尝试了 perl 方法

cat '/myFile.txt' | perl -ne 's/(?<=\[)(\|)(?=\])/xxxxx/g; print;'

仍然没有得到改变的结果。

最佳答案

你的lookbehind 和lookahead 正则表达式试图匹配单个字符。如果您的输入文本恰好包含 [|],它们可能会起作用。 .

理论上,您希望后视类似于 (?<=\[.*)。但现实是大多数引擎不处理任意长度的回溯。

你可以使用 sed {command ; block }实现循环,一次将行的各个段附加到内部缓冲区,然后在匹配停止后发出整行。

IMO,一个更好的主意是切换到一种允许您使用括号来分隔文本的语言。

例如,您可以使用 awk、perl 或 python 来抓取 [] 之间的文本然后单独处理。这些不是正则表达式,而是小脚本。

最后,另一种选择可能是先用特殊标记替换开括号,然后在闭括号中添加换行符:

sed -e 's/\[/\n@[/g' -e 's/]/]\n/g'

这会将括号内的文本放在它们自己的行中,因此您可以通过执行模式寻址的全行替换来遵循:

sed -e '/^@\[/s/\|/;/g' # On lines starting with @[ replace | with ;

现在你必须把线粘在一起,你可以找到here

关于regex - 正则表达式 - Linux - 之间,但不包括,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54790244/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com