gpt4 book ai didi

java - JSoup URL 链接困难

转载 作者:太空宇宙 更新时间:2023-11-04 07:15:25 24 4
gpt4 key购买 nike

我无法从此元素获取超链接。我尝试过 element.attr("href") 和 element.abs("href") 无济于事。这是我试图提取的内容:

 <p ><strong>Previous Chapter:</strong> <a href="http://www.mangahere.com/manga/mirai_nikki/v07/c031/">Mirai Nikki 31</a>

我想要来自该源的 URL,但无法使其正常工作。

这是我到目前为止的代码:

Document doc;
try{
doc = Jsoup.connect(currentURL).get();
Element e = doc.getElementsByClass("reader_tip").first().children().last().children().first();
System.out.println(e.text());
String backPage = e.attr("href");

loadPage(backPage);
}
catch(Exception ex){
ex.printStackTrace();
}

以及相关网址:

http://www.mangahere.com/manga/mirai_nikki/v07/c032/

这可能是很简单的事情,我忽略了它。如果有人可以提供帮助,我们将不胜感激。

最佳答案

您可以将选择器简化为 p:contains(Previous Chapter) a,它会查找包含文本“Previous Chapter”的 P 标签内的 A 标签。

完整示例:

String url = "http://www.mangahere.com/manga/mirai_nikki/v07/c032/";
String ua = "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_8_2) AppleWebKit/537.33 (KHTML, like Gecko) Chrome/27.0.1438.7 Safari/537.33";

Document doc = Jsoup.connect(url).userAgent(ua).timeout(10 * 1000).get();
Element a = doc.select("p:contains(Previous Chapter) a").first();
String backUrl = a.attr("href");

System.out.println(String.format("Back URL: %s (%s)", backUrl, a.text()));

打印:

Back URL: http://www.mangahere.com/manga/mirai_nikki/v07/c031/ (Mirai Nikki 31)

请参阅Try jsoupjsoup select syntax documentation .

关于java - JSoup URL 链接困难,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20038933/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com