gpt4 book ai didi

java - Java 中一个文件可以用多种字符集编码吗?

转载 作者:行者123 更新时间:2023-12-03 01:58:45 26 4
gpt4 key购买 nike

我正在开发一个 Java 插件,它允许人们通过指定他们希望使用的字符集编码来写入和读取文件。但是,我对如何在单个文件中编码多种编码感到困惑。例如,假设 A 字符来自一种字符集,B 字符来自另一种字符集,是否可以将“AAAAABBBBBBAAAAA”写入文件?

如果不可能,对于任何编程语言,或者特别是 Java,这通常都是如此吗?如果可能的话,我将如何继续读取(解码)文件?

我不想使用Charset 的encode() 和decode() 方法,因为它们的测试失败了(某些字符集未正确解码)。由于各种原因我也不想使用第三方程序,因此这个问题的范围纯粹在标准java包/代码中。

非常感谢!
国家统计局

最佳答案

您需要将其作为字节流读取,并事先知道字符在哪个字节位置开始和结束,或者使用一些特殊的分隔符字符/字节范围来指示字符组的开始和结束。这样您就可以获取特定字符组的字节,并最终使用所需的字符编码对其进行解码。

此问题并非 Java 特有。这个要求很奇怪。我想知道像这样混合字符编码有什么意义。始终使用一种统一的编码,例如 UTF-8,它几乎支持人类认识的所有字符。

关于java - Java 中一个文件可以用多种字符集编码吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10584190/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com