gpt4 book ai didi

java - 为什么Java I/O中的一个字节可以代表一个字符?

转载 作者:行者123 更新时间:2023-12-02 22:05:01 24 4
gpt4 key购买 nike

为什么Java I/O中的一个字节可以代表一个字符?

我看到这些字符只是 ASCII。那么它就不是动态的,对吧?

这有什么解释吗?

字节流和字符流有什么区别?

最佳答案

字节不是字符。单独而言,它们甚至无法代表字符。

从计算角度来看,“字符”是数字代码(或代码序列)与编码字符集的配对,定义了代码如何映射到实际数据-世界字符(或空白,或控制代码)。

只有与编码配对,字节才能表示字符。对于某些编码(例如 ASCII 或 ISO-8859-1),一个字节可以代表一个字符...许多编码甚至与 ASCII 兼容(意味着从 0 到 127 的字符代码与 ASCII 的定义一致)。 .但是如果没有原始映射,您将不知道自己拥有什么。

如果没有编码,字节只是 8 位整数。

您可以通过对它们强制编码来以任何您喜欢的方式解释它们。这正是您在将 byte 转换为 char 时所做的事情,例如 new String(myBytes) 等,甚至编辑文本编辑器中包含字节的文件。 (在这种情况下,是编辑器应用编码。)这样做,您甚至可能会得到一些有意义的东西。但如果不知道原始编码,您就无法确定这些字节想要表示什么。

它甚至可能不是文本。

例如,考虑字节序列0x48 0x65 0x6c 0x6c 0x6f 0x2e。可以理解为:

  • Hello. 采用 ASCII 和兼容的 8 位编码;
  • dinner 采用某种 8 位编码,我只是为了证明这一点而编写的;
  • 䡥汬漮 采用大端 UTF-16*;
  • 一个钢蓝色像素,后面跟着一个灰黄色像素,采用 RGB 格式;
  • 以某些未知处理器的汇编语言加载 r101,[0x6c6c6f2e]

或一百万个其他事物中的任何一个。仅这六个字节无法告诉您哪种解释是正确的。

至少对于文本来说,这就是编码的用途。

但是如果您希望解释正确,则需要使用与生成这些字节相同的编码来解码这些字节。这就是为什么了解文本的编码方式如此重要。

<小时/>

字节流和字符流之间的区别在于字符流尝试使用字符而不是字节。 (它实际上适用于 UTF-16 代码单元。但是由于我们知道编码,这对于大多数用途来说已经足够了。)如果它包装在字节流中,则字符流使用编码来转换从底层字节流读取的字节到 char(或将 char 写入流中的字节)。

*注意:我不知道“䡥汬漮”是否是脏话,甚至是否有任何意义......但计算机也没有,除非你对其进行编程以读取中文。

关于java - 为什么Java I/O中的一个字节可以代表一个字符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3737100/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com