gpt4 book ai didi

java - 正则表达式多行html代码?

转载 作者:行者123 更新时间:2023-12-01 07:36:59 25 4
gpt4 key购买 nike

如何使用正则表达式提取以下内容?

String string = "<h1>1st header</h1>" + "<h2>second header</h2>" +
"<p>some text</p>" + "<hr />";

Pattern p = Pattern.compile("</h1>(\\S+)<hr />", Pattern.MULTILINE);

输出为空,但为什么?

最佳答案

输出为空,因为 </h1> 之间的字符和<hr />包括空格。您的\S+一旦遇到空格就会失败。

如果替换 \\S+比如说,.+ ,它应该捕获高度具体的示例字符串中的所有内容。但是,如果您想“正确”执行此操作,并且能够匹配不完全适合您的示例的任意 HTML,请使用像 HTML Agility Pack 这样的 HTML 解析器。基于解析器的版本将是简单、正确的,但不会endanger your sanity and/or the universe.

关于java - 正则表达式多行html代码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10609298/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com