gpt4 book ai didi

Java的字符集/字符编码

转载 作者:塔克拉玛干 更新时间:2023-11-01 21:34:38 25 4
gpt4 key购买 nike

我有一个西类牙语文件,里面全是这样的字符:

 á é í ó ú ñ Ñ Á É Í Ó Ú 

我必须读取文件,所以我这样做:

fr = new FileReader(ficheroEntrada);
BufferedReader rEntrada = new BufferedReader(fr);

String linea = rEntrada.readLine();
if (linea == null) {
logger.error("ERROR: Empty file.");
return null;
}
String delimitador = "[;]";
String[] tokens = null;

List<String> token = new ArrayList<String>();
while ((linea = rEntrada.readLine()) != null) {
// Some parsing specific to my file.
tokens = linea.split(delimitador);
token.add(tokens[0]);
token.add(tokens[1]);
}
logger.info("List of tokens: " + token);
return token;

当我读取 token 列表时,所有特殊字符都消失了,并被这种字符所取代:

Ó = Ó
Ñ = Ñ

等等……

这是怎么回事?我从来没有遇到过字符集问题(我假设是字符集问题)。是因为这台电脑吗?我能做些什么?

任何额外的建议将不胜感激,我正在学习!谢谢你!

最佳答案

需要指定相关的字符编码。

BufferedReader rEntrada  = new BufferedReader(
new InputStreamReader(new FileInputStream(fr), "UTF-8"));

关于Java的字符集/字符编码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13495924/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com