gpt4 book ai didi

java - 使用正则表达式在java中拆分字符串

转载 作者:行者123 更新时间:2023-11-30 11:30:55 26 4
gpt4 key购买 nike

我想在一些标签(div 和 p)的开头和结尾拆分文本,但不是全部。

Input:
String html = "text<div>some text</div><tag>text</tag><span>asd</span><p>text</p>text";

Output:
text
<div>some text</div>
<tag>text</tag><span>asd</span>
<p>text</p>
text

我应该使用什么正则表达式?

最佳答案

你可以用这个正则表达式拆分

(?<=</(div|p)>)|(?=<(div|p)>)

但正如其他人推荐的那样,使用 html 解析器..


但是为什么要使用解析器..

考虑上面的正则表达式。它不会工作

  • 如果你有嵌套标签..(没有 REGEX 可以解决这个问题..它几乎不可能)
  • 如果标签有属性
  • 如果标签内有任意数量的空格

虽然,不清楚为什么要进行此拆分

关于java - 使用正则表达式在java中拆分字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17521385/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com