gpt4 book ai didi

java - 我无法使用 Java 代码接收网站的所有 HTML 内容

转载 作者:行者123 更新时间:2023-12-02 00:03:12 25 4
gpt4 key购买 nike

我使用 Java 来接收网站的 HTML 内容。但我无法接收其全部内容。有时,我收到的内容以“...”结尾,但并不是内容的结尾。你能告诉我什么是错误吗?下面是我的代码:

public static String requestHtmlContent(String sUrl){
URL url;
URLConnection connection;
StringBuilder strBuilder = new StringBuilder();
BufferedReader reader;
try {
url = new URL( sUrl );
connection = url.openConnection();
connection.setRequestProperty("User-Agent", "Mozilla/6.0 (Windows NT 6.2; WOW64; rv:16.0.1) Gecko/20121011 Firefox/16.0.1");
InputStream is = url.openConnection().getInputStream();
reader = new BufferedReader( new InputStreamReader( is ) );

String line = null;
while((line = reader.readLine())!= null); {
line = reader.readLine();
strBuilder.append(line +"\n");
}
reader.close();

return strBuilder.toString();

} catch (MalformedURLException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
return strBuilder.toString();
}

最佳答案

在没有实际测试你的代码的情况下,我可以说这个 while 循环绝对是可疑的:

while((line = reader.readLine())!= null);  {
line = reader.readLine();
strBuilder.append(line +"\n");
}

while 条件消耗读取器中的一行,但该行永远不会被处理。

关于java - 我无法使用 Java 代码接收网站的所有 HTML 内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14427173/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com