gpt4 book ai didi

java - 使用 jSoup 解析内部 html 标签

转载 作者:行者123 更新时间:2023-12-01 11:26:51 25 4
gpt4 key购买 nike

我想使用 Jsoup 库查找网站中的重要链接。因此,假设我们有以下代码:

<h1><a href="http://example.com">This is important </a></h1>

现在在解析时我们如何发现标签 a 在 h1 标签内?

最佳答案

你可以这样做:

File input = new File("/tmp/input.html");
Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/");

Elements headlinesCat1 = doc.getElementsByTag("h1");
for (Element headline : headlinesCat1) {
Elements importantLinks = headline.getElementsByTag("a");
for (Element link : importantLinks) {
String linkHref = link.attr("href");
String linkText = link.text();
System.out.println(linkHref);
}
}

取自 JSoup Cookbook .

关于java - 使用 jSoup 解析内部 html 标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30754778/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com