gpt4 book ai didi

java - 在 Java 中读取 UTF-8 文件时出错

转载 作者:行者123 更新时间:2023-11-30 07:36:44 26 4
gpt4 key购买 nike

我正在尝试从包含 unicode 字符的文件中读取一些句子。它确实打印出一个字符串,但由于某种原因它弄乱了 unicode 字符

这是我的代码:

public static String readSentence(String resourceName) {

String sentence = null;
try {
InputStream refStream = ClassLoader
.getSystemResourceAsStream(resourceName);
BufferedReader br = new BufferedReader(new InputStreamReader(
refStream, Charset.forName("UTF-8")));
sentence = br.readLine();
} catch (IOException e) {
throw new RuntimeException("Cannot read sentence: " + resourceName);
}
return sentence.trim();
}

最佳答案

问题可能在于字符串的输出方式。

我建议您通过执行以下操作来确认您正在正确读取 Unicode 字符:

for (char c : sentence.toCharArray()) {
System.err.println("char '" + ch + "' is unicode codepoint " + ((int) ch)));
}

并查看 Unicode 代码点对于被弄乱的字符是否正确。如果正确,则问题出在输出端;如果不正确,则问题出在输入端。

关于java - 在 Java 中读取 UTF-8 文件时出错,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3329040/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com