gpt4 book ai didi

java - Java 中 String 类的成员使用了哪种 utf8 编码?

转载 作者:行者123 更新时间:2023-11-29 06:19:57 24 4
gpt4 key购买 nike

String 类有一个构造函数:

 new String(byte[] bytes, Charset charset)

和一个方法:

 byte[] getBytes(Charset charset)

鉴于我定义我的 charset 如下:

 Charset charset = Charset.forName("UTF-8");

我实际上会使用什么样的编码?更具体地说,它是标准的 UTF-8(如 RFC 3629 中所述),还是 CESU-8 , 或 Modified UTF-8 ? (另见相应的 Wikipedia article )

如果它不是标准的 UTF-8,是否有允许在 utf8 中进行字符串操作的库?

这些 UTF-8 派生编码的转换器非常受欢迎!

最佳答案

The UTF-8 charset is specified by RFC 2279; the transformation format upon which it is based is specified in Amendment 2 of ISO 10646-1 and is also described in the Unicode Standard.

http://download-llnw.oracle.com/javase/6/docs/api/java/nio/charset/Charset.html

关于java - Java 中 String 类的成员使用了哪种 utf8 编码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3544327/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com