gpt4 book ai didi

java - 从返回 403 禁止的网站读取 HTML

转载 作者:行者123 更新时间:2023-11-29 05:23:31 24 4
gpt4 key购买 nike

<分区>

我正在尝试在此处编写网络抓取工具,但该网站向我的代码返回了 403 forbidden,即使它是可通过浏览器访问的网页。我的主要问题是:这是他们在网站上设置的阻止网络抓取的东西,还是我做错了什么?

import java.net.*;
import java.io.*;

public class Main {
public static void main(String[] args) throws Exception {

URL oracle = new URL("http://www.pcgs.com/prices/");
BufferedReader in = new BufferedReader(
new InputStreamReader(oracle.openStream()));

String inputLine;
while ((inputLine = in.readLine()) != null)
System.out.println(inputLine);
in.close();
}
}

如果我将 url 更改为类似 http://www.google.com 的网站然后它将返回html。如果该站点被阻止,是否有解决办法?感谢您的帮助

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com