gpt4 book ai didi

java - 从具有属性的 JSoup 标记中提取链接

转载 作者:行者123 更新时间:2023-11-28 04:52:26 25 4
gpt4 key购买 nike

在 HTML 文档中我有以下标签

<a id="myUniqueID" class="myClassName" href="/uniqueURLToExtract" data-original-title"">This is a Title</a>

我正在使用 JSoup 并想提取包含在 href 中的 URL由 myUniqueID 识别.在阅读了关于 SO 的以下主题之后

  1. Jsoup - extracting data from an <a> tag, inside a <td> tag

  2. JSoup parsing data from within a tag

我想到了这段代码

...
document = Jsoup.connect(mySiteAddress).timeout(10*1000).get();
...
String URLStr = document.select(a[id=myUniqueID]").text();

但这只是打印

This is a Title

我尝试过其他变体,但都没有成功。我要么没有打印任何内容,要么以空指针异常结束。

我不确定如何提取由 ID myUniqueID 标识的 URL在<a>标签。

最佳答案

尝试:

String URLStr = document.select("a[id=myUniqueID]").attr("href");

所以 attr() 优于 text()

关于java - 从具有属性的 JSoup <a> 标记中提取链接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29568699/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com