gpt4 book ai didi

regex - NotePad++ 正则表达式删除包含嵌入标签的 HTML 标签

转载 作者:行者123 更新时间:2023-12-01 11:39:21 24 4
gpt4 key购买 nike

使用 Notepad++,技术作家部门需要删除 <span class..>xxx</span>来自这样的文本的标签:

`<span class="temp">See</span> Problems pane <span class="temp">for more <b>information</b>.</span>`

(澄清:)期望的结果是没有 span 标签的元素的内部文本。上述示例的输出将是:

 `See Problems pane for more <b>information</b>.`

我认为我需要的是这样的:
查找:<span..>(capture anything except "</span>")</span>
替换:\1

我无法使用 ([^<])*作为捕获组,因为跨度中的其他标签,如 <b>在示例中。

我无法使用 <span class=\"temp\">(.*)</span>因为一条线上可能有两个这样的。

我已经尝试使用非贪婪语法关闭整个标签,并使用我在其他帖子中找到的示例计算 {1} 语法,但我无法让它工作。

我找到了几篇关于否定表达式的帖子,但无法让它们在捕获组中的否定 HTML 标记上工作。有一个帖子包含我的确切问题,但使用的是 PHP 而不是 Notepad++。

如果有任何建议,我将不胜感激。

最佳答案

要删除 ALL 标记,请使用:

发现什么:

<.*?>|</.*?>

替换为:

没什么

enter image description here




要删除 SPECIFIC 标签,请使用:

发现什么:

<(span|othertag).*?>|</(span|othertag)>

替换为:

没什么

enter image description here

关于regex - NotePad++ 正则表达式删除包含嵌入标签的 HTML 标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33066103/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com