gpt4 book ai didi

java - 用于 HTML 替换的正则表达式

转载 作者:行者123 更新时间:2023-11-29 06:14:04 24 4
gpt4 key购买 nike

您好,我正在寻找 RegEx,它可以帮助我替换 HTML 中的单词。如果我要替换的词也在 HTML 标记中,则会出现问题。

示例:<img class="TEST">asd TEST asd dsa asd </img>
我只需要获得第二个“测试”。

我正在寻找的正则表达式应该看起来像>[^<]*TEST , 但此正则表达式也在 TEST 一词之前采用字符。是否可以只选择单词 TEST ?但也可以想象其他组合(我不认为“TEST ”是一个很好的解决方案,因为文本也可以包含其他字符)

最佳答案

首先,正则表达式不是 html 解析的好选择。您可以使用许多增强的 html 解析器。

但如果你坚持使用正则表达式,这里是正则表达式;

(?<=>.*)TEST(?=.*<)

对于 Java,

(?<=>.{0,100000})TEST(?=.{0,100000}<)

有关为什么我们不能在 Java 中使用 * 或 + 与 lookbehind regex 的更多信息,Regex look-behind without obvious maximum length in Java

关于java - 用于 HTML 替换的正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5744802/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com