gpt4 book ai didi

java - 正则表达式拆分字符串中的标签

转载 作者:行者123 更新时间:2023-11-29 09:20:54 24 4
gpt4 key购买 nike

我有以下正则表达式 (<.*?>.*?</.*?>|[\w[-]]+)\p{Punct}*它适用于大多数带有标签的字符串,但如果标签前面没有空格,那么它会在找到匹配项时破坏标签。

请帮助我修改此正则表达式,使其不会破坏标签。我所寻找的只是按空格拆分,但如果空格在标记内则不会拆分。

例如:

BIRD-<abc attr="co_1">ab</span> @apos;<abc attr="co_12">cd</span>FEE DEF

should split into:

BIRD-<abc attr="co_1">ab</span> @apos;<abc attr="co_12">cd</span>FEE  DEF

I am currently using a matcher to match this pattern and get the tokens

Matcher matcher = REGEX.matcher(newString);

while (matcher.find())
{
token = matcher.group();
}

最佳答案

试试这个:

.*?<.*?>.*?</.*?>[^\s]*

它将产生您期望的结果。

关于java - 正则表达式拆分字符串中的标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6533661/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com