gpt4 book ai didi

java - 使用 JSoup 抓取 HTML,出现 HTTP 错误,状态 456

转载 作者:行者123 更新时间:2023-11-30 04:14:21 25 4
gpt4 key购买 nike

我正在尝试使用 JSoup 抓取网站 (www.oddsportal.com),但遇到了问题。

String url = "http://www.oddsportal.com/matches/";      
Document doc = null;
System.out.println("Connecting to " + url + "...");
try {
doc = Jsoup.connect(url).get();
} catch (IOException e1) {
e1.printStackTrace();
}

当我连接并执行“获取”时,我得到以下信息:

 Connecting to http://www.oddsportal.com/matches/...

org.jsoup.HttpStatusException: HTTP error fetching URL. Status=456,
URL=http://www.oddsportal.com/matches/
at org.jsoup.helper.HttpConnection$Response.execute(HttpConnection.java:435)
at org.jsoup.helper.HttpConnection$Response.execute(HttpConnection.java:410)
at org.jsoup.helper.HttpConnection.execute(HttpConnection.java:164)
at org.jsoup.helper.HttpConnection.get(HttpConnection.java:153)

可能是什么原因?似乎没有 HTTP 456 状态代码,所以我认为它是某种特定于站点的代码?该网站有登录功能,但查看内容不是必需的。我尝试过的其他网站效果很好。

最佳答案

如果您包含用户代理,它将起作用,来自 documentation :

Document doc = Jsoup.connect("http://example.com").userAgent("Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:25.0) Gecko/20100101 Firefox/25.0").get();

关于java - 使用 JSoup 抓取 HTML,出现 HTTP 错误,状态 456,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18771309/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com