java - URLConnection 不读取整个页面-6ren

java - URLConnection 不读取整个页面

转载作者：塔克拉玛干更新时间：2023-11-03 00:59:31

25

4

在我的应用程序中，我需要下载一些网页。我是这样做的

URL url = new URL(myUrl);
HttpURLConnection conn = (HttpURLConnection) url.openConnection();
conn.setReadTimeout(5000000);//5 seconds to download
conn.setConnectTimeout(5000000);//5 seconds to connect
conn.setRequestMethod("GET");
conn.setDoInput(true);

conn.connect();
int response = conn.getResponseCode();
is = conn.getInputStream();

String s = readIt(is, len);
System.out.println("got: " + s);

我的 readIt 函数是:

public String readIt(InputStream stream) throws IOException {
    int len = 10000;
    Reader reader;
    reader = new InputStreamReader(stream, "UTF-8");
    char[] buffer = new char[len];
    reader.read(buffer);
    return new String(buffer);
}

问题是它没有下载整个页面。例如，如果 myUrl 是“https://wikipedia.org”，那么输出是

如何下载整个页面？

更新来自这里的第二个答案 Read/convert an InputStream to a String解决了我的问题。问题出在 readIt 函数中。您应该像这样读取来自 InputStream 的响应:

static String convertStreamToString(java.io.InputStream is) {
   java.util.Scanner s = new java.util.Scanner(is).useDelimiter("\\A");
   return s.hasNext() ? s.next() : "";
}

最佳答案

你的代码有很多错误:

您正在读入一个固定大小的字符缓冲区。
您忽略了 read(char[]) 方法的结果。它返回实际读取的字符数……您需要使用它。
您假设 read(char[]) 将读取所有数据。事实上，它只保证返回至少一个字符......或零以指示您已到达流的末尾。当您从网络连接到达时，您只能获取另一端已发送并在本地缓冲的数据。
当您从 char[] 创建字符串时，您假设字符数组中的每个位置都包含流中的一个字符。

有多种方法可以正确地做到这一点，这是一种方法:

public String readIt(InputStream stream) throws IOException {
    Reader reader = new InputStreamReader(stream, "UTF-8");
    char[] buffer = new char[4096];
    StringBuilder builder = new StringBuilder();
    int len;
    while ((len = reader.read(buffer) > 0) {
        builder.append(buffer, 0, len);
    }
    return builder.toString();
}

另一种方法是使用 readFully(Reader) 方法查找现有的第 3 方库方法。

关于java - URLConnection 不读取整个页面，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34311971/

25

4

0

文章推荐： c++ - C++ 中的泛型类

文章推荐： linux - htaccess 规则不适用于 linux 服务器

文章推荐： linux - alloc_pages() 与 __free_pages() 配对

java - 从 ArrayList 中移除 URLConnection 对象
在我的程序中，我需要跟踪已打开的与某些 HTTP 服务器的连接列表 - 以便在需要时立即断开连接。我遇到了以下问题。如果我连接到 HTTP 服务器，一切正常，但如果连接到 HTTPS，则连接不会从列
java - 为什么必须调用 URLConnection#getInputStream 才能写出 URLConnection#getOutputStream？
我正在尝试写信给 URLConnection#getOutputStream ，但是，在我调用 URLConnection#getInputStream 之前，实际上并没有发送任何数据。 .即使我设置
android - URLConnection - 读取响应后无法写入请求正文
我有一组对象，我试图通过 POST 发送到 API。第一个对象将按原样通过，然后我得到: java.net.ProtocolException: cannot write request body a
java - URLConnection 编码问题与重音字符
我在尝试发送文本时遇到 URLConnection 编码问题。我的代码是这样的: final URL url = new URL(urlString); final URLConnection ur
java - URLConnection 的错误处理
我有这种方法，可以从雅虎财经下载 .csv 文件并将其保存在本地。它是在循环期间访问的，因此它从列表中下载许多文件。然而，有时符号输入不正确、不再存在或连接超时。如何修改此方法，以便重试连接超时并跳过
Java URLConnection 响应已编码
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import
java - urlconnection 不读取内容长度
打开 URLConnection 时，我使用以下代码来获取内容长度，但它返回 -1。 URL url = new URL(sUrl[0]); URLConnection connection = ur
Java:URLConnection 的合理超时时间
默认情况下，URLConnection 的超时为 0，这是无限制的。 XXXXX 的合理值是多少？ URL url = ... URLConnection uCon = url.openConnect
java - 使用特定网络资源打开 URLConnection
我无法打开具有特定网络资源的 URLConnection。我得到了 “java.net.ConnectException:连接超时:”。是因为该域阻止了直接 URL 连接吗？如果是这样，他们是如何阻止
Java urlConnection，将音频文件保存到服务器？
我看过文本文件示例，但是否以与 URLConnection 相同的方式将音频文件直接保存到服务器？最佳答案是的，一样的。尽管确保使用二进制输出流将内容写入磁盘。类似于: URLConne
Java URLConnection 整数问题
我一直在尝试从网页获取信息，特别是此网站:http://www.ncbi.nlm.nih.gov/pubmed?term=%22pulmonary%20disease%2C%20chronic%20o
android - 带参数的 URLConnection
在我使用 Apache 库 (org.apach.httpclient) 向带有参数 (BasicNameValuePair) 的 Php 脚本发出请求之前，然后现在我想删除那些库以减小 APK 大
java - URLConnection 超时问题
我正在使用 android 应用程序，我正在从 url 下载文件。一切正常，但是当互联网连接介于两者之间(打开连接后)时，下载超时永远不会发生并且连接永远不会结束。给我一个解决这个问题的方案
android - URLConnection 错误
我只是想了解一下 JacksonJson 库。为此，我尝试将 Places API 中的 JSON 数据转换为字符串。我的 key 有效(我在浏览器和另一个应用程序中进行了测试)，但出现错误。这是代
java - UrlConnection 无内容类型
我目前正在 Eclipse 上使用 Java 7、Maven、Spring MVC 和 Eclipselink JPA 编写 Web 服务，以访问连接到内部网络的温度/湿度传感器的值。我使用 curl
java - URLConnection 不使用代理设置
HttpsURLConnection 有问题 - 未使用代理。这是代码: //proxy String type = "https"; System.getProperties().put(type
java - UrlConnection 无内容类型
我目前正在 Eclipse 上使用 Java 7、Maven、Spring MVC 和 Eclipselink JPA 编写一个 Web 服务，以访问连接到内部网络的温度/湿度传感器的值。我使用cur
java - URLConnection 不读取整个页面
在我的应用程序中，我需要下载一些网页。我是这样做的 URL url = new URL(myUrl); HttpURLConnection conn = (HttpURLConnection) url
java - URLConnection 低级字节计数
我正在尝试使用 URLConnection 获得最低级别的字节计数.我已经用 CountingInputStream 计算了两个流传递的数据和 CountingOutputStream来自 Apach
Android - URLConnection 的默认用户代理？
我正在使用这段代码创建一个常规的 HTTP 连接: URLConnection cn = new URL( "http://...." ).openConnection(); cn.connect()

首页

博学

6Ren·AI

商城

java - URLConnection 不读取整个页面