java - 为什么 Java 的 String.getBytes() 使用 "ISO-8859-1"-6ren

java - 为什么 Java 的 String.getBytes() 使用 "ISO-8859-1"

转载作者：太空狗更新时间：2023-10-29 22:36:24

29

4

来自 java.lang.StringCoding :

String csn = (charsetName == null) ? "ISO-8859-1" : charsetName;

这是 Java.lang.getBytes() 在 linux jdk 7 中使用的内容我一直以为 UTF-8 是默认字符集？

谢谢

最佳答案

有点复杂...

Java 尝试使用默认字符编码通过 String.getBytes() 返回字节。

默认字符集由系统 file.encoding 属性提供。
这是缓存的，在 JVM 启动后通过 System.setProperty(..) 更改它是没有用的。
如果 file.encoding 属性未映射到已知字符集，则指定 UTF-8。

....这是棘手的部分(可能永远不会发挥作用)....

如果系统无法使用默认字符集(UTF-8 或其他字符集)对字符串进行解码或编码，则会回退到 ISO-8859-1。如果回退不起作用......系统将失败!

....真的...(喘气!)...如果我指定的字符集无法使用，UTF-8 或 ISO-8859-1 也无法使用，它会崩溃吗？

是的。 StringCoding.encode(...) 方法中的 Java 源注释状态:

// If we can not find ISO-8859-1 (a required encoding) then things are seriously wrong with the installation.

...然后调用 System.exit(1)

那么，为什么在 getBytes() 方法中有意回退到 ISO-8859-1？

尽管可能性不大，但用户的 JVM 可能不支持以 UTF-8 或 JVM 启动时指定的字符集进行解码和编码。

那么，String类在getBytes()时是否正确使用了默认字符集？

没有。然而，更好的问题是......

String.getBytes() 是否兑现了它的 promise ？

Javadoc 中定义的契约是正确的。

The behavior of this method when this string cannot be encoded in the default charset is unspecified. The CharsetEncoder class should be used when more control over the encoding process is required.

好消息(以及更好的做事方式)

始终建议在将字节转换为字符串时明确指定“ISO-8859-1”或“US-ASCII”或“UTF-8”或您想要的任何字符集，反之亦然——除非——你之前已获得默认字符集并 100% 确定它是您需要的字符集。

改为使用此方法:

public byte[] getBytes(String charsetName)

要查找系统的默认值，只需使用:

Charset.defaultCharset()

希望对您有所帮助。

关于java - 为什么 Java 的 String.getBytes() 使用 "ISO-8859-1"，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/12659417/

29

4

0

文章推荐： java - 将逗号分隔值转换为 List

文章推荐： c# - 用户很快退出

文章推荐： c# - 只有静态方法的类应该是静态的吗？

文章推荐： java - 为什么单线程比 Java 中的多线程快？

iso - ISO 8583 的完整声明
我想知道是否可以通过 ISO 8583 做一个完整的声明(在一个日期范围之间)，我看到 ATM 可以做完整的声明并且想知道他们使用什么方法。我知道余额查询和迷你报表可以在超过 8583 的 POS 设
iso - 7zip ISO 提取
我一直在尝试通过 7zip 和 WinRar 提取 ISO 镜像。这是我使用的命令行: 7z x -y "%Isocontents%\ISO.iso" -o%Newfolder% WinRar.ex
internationalization - 获取给定 IETF 语言标签(或 ISO 639-ISO 3166-1 对)的 ISO 15924 脚本代码
我正在将 ICU 集成到一些内部软件中。我希望能够获取诸如“en_US”之类的字符串并为其获取脚本名称“Latin”。 (虽然最终我实际上想要一个 ICU ScriptCode。) 我尝试使用 ICU
r - 使用仅包含 ISO 周的数据集将 ISO 周聚合为几个月
我的数据位于一个数据框中，其结构如下: df2 <- data.frame(Year = c("2007"), Week = c(1:12), Measurement = c(rnorm(12, me
SQL 获取 ISO 周的 "ISO Year"
我需要计算一周分配到的年份。例如，2003 年 12 月 29 日被指定为 2004 年的第一周(我认为这仅适用于欧洲)。您可以使用以下代码来查看: SELECT DATEPART(isowk, '2
android - 如何提取 ISO 文件，然后将其重新打包成可用的 ISO 文件？
我想做什么？我想提取 ISO 文件并编辑其中的文件，然后将其重新打包回 ISO 文件。 (正如你已经读过的) 我为什么要这样做？我想开始修改 PSP ISO，为此我必须使用游戏资源、 Assets
project-management - ISO 标准如何运作(尤其是 ISO 9126)
关闭。这个问题需要更多focused .它目前不接受答案。想改善这个问题吗？更新问题，使其仅关注一个问题 editing this post . 2年前关闭。 Improve this questi
python - Python 中的 ISO 时间 (ISO 8601)
我有一个文件。在 Python 中，我想占用它的创建时间，并将其转换为 ISO time (ISO 8601) string 同时保留它是在 Eastern Time Zone 中创建的事实。 (美国
localization - ISO 639 语言列表，翻译成每种 ISO 639 语言
关闭。这个问题是off-topic .它目前不接受答案。想改善这个问题吗？ Update the question所以它是 on-topic对于堆栈溢出。 8年前关闭。 Improve this q
matplotlib - 二维标量场 : draw iso surface (iso line) with opacity
我在二维网格上有两个标量场。我想为第一个标量场绘制一条等值线，并根据第二个标量场设置其不透明度。我从 this SO answer 开始尝试使用 mayavi但我无法从 3D 切换到 2D。下面是
haskell - 为什么镜头包含用于 fromEnum/toEnum 的 Iso，而不包含用于显示/读取的 Iso？
假设您声明两个同构 showing :: (Read a, Show a) => Iso' String a showing = iso read show reading :: (Read a, S
python - 将 ISO 639-1 转换为 ISO 639-2
已关闭。此问题旨在寻求有关书籍、工具、软件库等的建议。不符合Stack Overflow guidelines准则。它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，
java - 在 Java 中检查字符串是否是 ISO 语言的 ISO 国家/地区的更简洁方法
假设有一个两个字符的String，它应该代表ISO 639国家或语言名称。你知道，Locale类有两个函数 getISOLanguages和 getISOCountries分别返回包含所有 ISO
iso - STEP 第 21 部分 (ISO 10303-21) CAD 文件中的值是否可以自由嵌入到实体中？
实体中的值是否可以自由嵌入到 ISO 10303-21 格式的文件中？在我看到的所有由 CAD 程序生成的示例中，length_measure 都嵌入在uncertainty_measure_wit
automation - Vagrant 是否可以直接使用操作系统 .ISO 安装镜像/或动态地从 ISO 创建 Vagrant 盒子？
是否可以从原始 ISO 自动创建用于操作系统安装的 Vagrant .box 文件？对我来说，Vagrant 提供的虚拟机上操作系统安装和配置的端到端自动化存在巨大差距。当然，VagrantBox
javascript - 使用 MomentJS 将 ISO 8601 转换为不同的 ISO 8601 格式
有没有办法实现这样的格式: 2003-09-25T14:00:00.000+1000 or 2003-09-25T14:00:00.000+1100 要这样转换 2003-09-25T14:00:00
java - ResolverStyle.STRICT 在 `@DateTimeFormat(iso = DateTimeFormat.ISO.DATE)` 中不起作用
我正在使用: @DateTimeFormat(iso = DateTimeFormat.ISO.DATE) @JsonFormat( pattern = "MM-dd-yyyy" ) private
java - 国家/地区代码 (iso-3166-1/iso-3166-2) 到经度和纬度
我需要将 iso-3166-1/iso-3166-2 代码转换为经度/纬度例子: 输入:“美国”，输出:(37.09024, -95.71289100000001)。输入“VE-O”，输出:(10
c++ - 基于 ISO-639/ISO-3166 的语言/国家语言环境名称与 Windows 名称之间的转换表
我想转换 POSIX 语言环境名称，例如 en_US、de_DEISO-639-1 和 ISO-3166 代码到 Windows English_United States、German_German
php - UTF-8 : successful conversion to iso-8859-1 but not to iso-8859-2
我在 MS Access 上有一个数据库，我通过调用 PDO 和 odbc 驱动程序将其与 PHP 一起使用。我的数据库中有法语、丹麦语和波兰语单词。法语和丹麦语没问题，但波兰语字符没办法，我只得到“

首页

博学

6Ren·AI

商城