gpt4 book ai didi

java - Jsoup 无法正确解析 HTML 链接

转载 作者:行者123 更新时间:2023-12-01 14:40:17 24 4
gpt4 key购买 nike

我一直在 Google 搜索博客中使用 Jsoup,一切都工作得很好,但是当我使用像这样的另一个网站时 WhosTalkin我无法提取结果数据和链接。我的代码:

Connection.Response response = null;
String url = "http://www.whostalkin.com/search?q=boston&x=0&y=0";
//
try {
response = Jsoup.connect(url)
.userAgent("Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.31 (KHTML, like Gecko) Chrome/26.0.1410.64 Safari/537.31")
.timeout(10000)
.execute();
} catch (IOException e) {
System.out.println("io - "+e);
}
// get page title
Document doc = response.parse();
String title = doc.title();
System.out.println("Page Title: " + title +"\n");

这是我提取数据的部分:

Elements links = doc.getElementsByTag("h3");
for (Element link : links) {
System.out.println("\nTitle: " + link.select("a").attr("title"));
System.out.println("Result: " + link.select("a").attr("href"));
}

当我只是想确保 Jsoup 无法正确解析 HTML 时,我使用了 Try Jsoup并获取 URL,他给了我 HTML 代码,当我用浏览器检查它时,该代码与代码不匹配。

最佳答案

您没有使用正确的选择器。查找 drill CSS 类。更容易获取元素。

Elements elementsByClass = parse.getElementsByClass("drill");
for (Element link : elementsByClass)
{
List<Node> childNodes = link.childNodes();
System.out.println("Title: " + childNodes.get(1));
System.out.println("Result: " + childNodes.get(0).attr("src"));
}

打印

Title:  Backtype
Result: http://www.whostalkin.com/img/backtype.png

Title: FriendFeed
Result: http://www.whostalkin.com/img/friendfeed.png

...

关于java - Jsoup 无法正确解析 HTML 链接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16033547/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com