gpt4 book ai didi

java - 读取编码错误的文件。 CP1252 与 UTF-8

转载 作者:行者123 更新时间:2023-11-30 09:16:38 26 4
gpt4 key购买 nike

我有字节数组,它放入 InputStreamReader 并对其进行一些操作。

Reader reader = new InputStreamReader(new ByteArrayInputStream(byteArr));

JVM 具有默认的 cp1252 编码,但我将其转换为字节数组的文件具有 utf-8 编码。此文件也有德语变音符号。当我将字节数组放入 InputStreamReader 时,java 将变音符号解码为错误的符号。例如 ü 表示为 ϼ。我试着输入“UTF-8”和 Charset.forName(“UTF-8”).newDecoder());到 InputStreamReader 构造函数,通过 new String(oldStr.getBytes("cp1252"), "UTF-8); 将字符串从读取器转换为具有新编码的字符串;但这没有帮助。在读取器变量的调试器中,我看到 StreamDecoder 参数,它具有“decoder"与 MS1252$Decoder 值。也许它正在解决我的问题,但我不明白,我该如何解决它。

最佳答案

尝试使用InputStreamReader(InputStream in, String charsetName)构造函数,自行设置charset。

Reader reader = new InputStreamReader(new ByteArrayInputStream(byteArr), "UTF-8");

关于java - 读取编码错误的文件。 CP1252 与 UTF-8,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19360843/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com