gpt4 book ai didi

java - 使用 Java 读取 anchor 标记内的 href

转载 作者:行者123 更新时间:2023-12-01 19:22:22 26 4
gpt4 key购买 nike

我有一个像这样的 HTML 片段:

<a href="XXXXXXXXXXXXXXX" target="_blank" class="view_job_link">View or apply to job</a>

我想使用 Java 读取 href 值 XXXXXXXXXX。

需要注意的是:我正在使用 inputstreamreader(url.openStream()) 从 URL 读取 HTML 文件。

我得到了一个完整的 HTML 文件,上面的代码片段是该文件的一部分。

我该怎么做?

谢谢

卡伦杰·阿南德

最佳答案

使用像 Jsoup 这样的 html 解析器。该 API 很容易学习,对于您的情况,下面的代码片段就可以了

URL url = new URL("http://example.com/");
Document doc = Jsoup.parse(url, 3*1000);
Elements links = doc.select("a[href]"); // a with href
for (Element link : links) {
System.out.println("Href = "+link.attr("abs:href"));
}

关于java - 使用 Java 读取 anchor 标记内的 href,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3484445/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com