gpt4 book ai didi

java - 将 ASCII 编码的字节数组转换为字符串会产生奇怪的结果

转载 作者:行者123 更新时间:2023-12-02 01:52:34 25 4
gpt4 key购买 nike

我正在用 Java 创建一个套接字应用程序,它从服务器接收一些 ASCII 格式的 HTML 数据,然后相应地解析这些数据。

byte[] receivedContent = new byte[12500];
receivedSize = inputStream.read(receivedContent);
receivedContent = Arrays.copyOf(receivedContent, receivedSize+1);
if (receivedSize == -1) {
System.out.println("ERROR! NO DATA RECEIVED");
System.exit(-1);
}
lastReceived = new String(receivedContent, StandardCharsets.US_ASCII);

这确实应该是非常简单的,但事实并非如此。我打印了一些调试消息,发现尽管收到了一些字节的数据(例如,priting receiveSize 告诉我它收到了 784 字节),这些字节生成的字符串只有几个字符长,如下所示:

Ard</a></li><li><a

我期待一个完整的 HTML 文档,所以这显然是错误的。关于这种情况何时发生也没有明显的模式。这看起来完全是随机的。由于我正在为缓冲区分配新内存,因此其中确实不应该有任何旧数据与套接字中的新数据混淆。有人可以解释一下这种奇怪的行为吗?而且,在运行 OracleJDK 的 Windows 计算机上,而不是在运行 OpenJDK 的远程 Ubunut 计算机上,这种情况发生的频率似乎较低,这可能就是原因吗?我该如何解决这个问题?

更新:最后我根据 ASCII 表手动检查了字节数组的 ASCII 编码,发现服务器故意发送乱码数据。谜团解开了。

最佳答案

而不是使用:

 inputStream.read(receivedContent);

您需要从流中读取所有数据。使用类似的东西(来自 apache commons io):

 IOUtils.readFully(inputStream, receivedContent)

关于java - 将 ASCII 编码的字节数组转换为字符串会产生奇怪的结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52773471/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com