gpt4 book ai didi

java - 正则表达式 - 如何通过它的类查找 HTML 标记内容?

转载 作者:行者123 更新时间:2023-11-29 06:58:11 24 4
gpt4 key购买 nike

我需要获取 <a> 的内容由某个 css 类名的 html 标签。我需要找到的 css 类是:whtbigheader

到目前为止我所做的是:

    content = "<A HREF='/articles/0,7340,L-4664450,00.html' CLASS='whtbigheader' style='color:#FFFFFF;' HM=1>need to get this value</A>";

Pattern p = Pattern.compile("<A.+?class\\s*?=[whtbigheader]['\"]?([^ '\"]+).*?>(.*?)</A>");
Matcher m = p.matcher(content);

if (m.find()) {
System.out.println("found");
System.out.println(m.group(1));
}
else {
System.out.println("not found");
}

期望值是:需要得到这个值

更多信息:

  • 只能使用正则表达式
  • 内容是一个完整的HTML字符串

有什么办法可以找到吗?

最佳答案

我讨厌使用 regex 进行 html 解析,这就是为什么解决方案可能不是请求者想要的:

使用 Jsoup实现这一目标:

String html; // your html code
Document doc = Jsoup.parse(html);
Elements elements=doc.select(".whtbigheader")` //<-- that's it, it contains all the tags with whtbigheader as its class.

确保你只得到一个标签:

Elements elements=doc.select("a").select(".whtbigheader");

要从您那里获取文本,只需遍历元素并获取文本:

for(Element element : elements){
System.out.println(element.text());
}

下载链接:

要下载 Jsoup 1.8.2,请单击 here :).

关于java - 正则表达式 - 如何通过它的类查找 HTML <a> 标记内容?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30638616/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com