gpt4 book ai didi

java - 为什么我们使用byte来读取二进制数据

转载 作者:行者123 更新时间:2023-12-01 08:08:06 25 4
gpt4 key购买 nike

我们使用 java 原语“字节”读取和写入二进制文件,例如 fileInputStream.read(byte)等等。在更多示例中,我们看到 byte[] = String.getBytes() 。一个字节只是 8 位值。为什么我们使用byte[]读取二进制文件?从文件或字符串读取后,字节值包含什么?

最佳答案

We read and write binary files using the java primitive 'byte' like fileInputStream.read(byte) etc.

因为操作系统将文件建模为字节序列(或更准确地说,为八位字节)。 byte 类型是 Java 中八位字节最自然的表示形式。

Why we use byte[] to read binaries?

与之前的答案相同。但实际上,您也可以通过其他方式读取二进制文件;例如使用DataInputStream

What does a byte value contains after reading from file or string ?

在第一种情况下,文件中的字节。

在第二种情况下,您不会从字符串中“读取”字节。相反,当您调用 String.getBytes() 时,您会获取组成字符串字符的字节(这些字符在特定字符集中编码)。如果您使用无参数 getBytes() 方法,您将获得 JVM 的默认字符集/编码。您还可以提供一个参数来选择不同的编码。

<小时/>

Java 对字节(8 位)数量和字符进行了明确区分。从概念上讲,Java 字符是 Unicode 代码点,字符串和类似的文本表示形式是字符序列……而不是字节序列。

(不幸的是,实现中存在一个“问题”。当 Java 被设计时,Unicode 字符空间适合 16 位;即有 <= 65536 个可识别的代码点。Java 被设计为匹配这个......并且 char 类型被定义为 16 位无符号整型。但是后来 Unicode 扩展到 > 65536 个代码点,Java 留下了一个尴尬的问题,即某些 Unicode 代码点无法用一个 char 值。相反,它们由一对 char 值表示......所谓的代理对 ...和 ​​Java字符串以 UTF-16 有效表示。对于大多数常见字符/字符集,这并不重要。但是如果您需要处理不常见的字符/字符集,则正确的处理方式使用字符串就是使用“codepoint”方法。)

关于java - 为什么我们使用byte来读取二进制数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19764448/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com