- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
请帮我解决这个问题。我正在尝试编写一个读取 .txt 文件的代码,然后它会计算文件中每个字母的频率。这就是我想到的:
public static void charCount(String file) throws IOException {
FileReader fr = new FileReader(file);
BufferedReader br = new BufferedReader(fr);
int[] count = new int[26];
String line;
while ((line = br.readLine()) != null) {
line = line.toUpperCase();
char[] characters = line.toCharArray();
for (int i = 0; i < line.length(); i++) {
if ((characters[i] >='A') && (characters[i] <='Z')) {
count[characters[i] - 'A']++;
}
}
}
File file2 = new File("D:/Project/Aufgabe/Winter_2019/frequency.txt");
file2.createNewFile();
FileWriter fw = new FileWriter(file2);
for (int i = 0; i < 26; i++) {
fw.write(((char)(i + 'A')) + ": " + count[i]);
}
fw.close();
br.close();
}
当我尝试使用 System.out.println() 在控制台中打印结果时,它给出了以下结果:
A: 15
B: 4
C: 9
D: 10
E: 2
F: 1
G: 0
H: 3
I: 5
J: 6
K: 3
L: 0
M: 2
N: 7
O: 3
P: 1
Q: 1
R: 0
S: 4
T: 0
U: 2
V: 0
W: 5
X: 0
Y: 1
Z: 0
这就是我想要的。但是当我尝试将其写入文件时,它会在 .txt 文件中给出以下结果:
㩁ㄠ䈵›䌴›䐹›〱㩅㈠㩆ㄠ㩇〠㩈㌠㩉㔠㩊㘠㩋㌠㩌〠㩍㈠㩎㜠㩏㌠㩐ㄠ㩑ㄠ㩒〠㩓㐠㩔〠㩕㈠㩖〠㩗㔠㩘〠㩙ㄠ㩚〠
我对java还是个新手,所以非常感谢您的帮助。
最佳答案
虽然您的程序有一些可以改进的地方,但它们都不是您看到汉字的原因。事实上,您的程序似乎工作得很好,并且生成的文件实际上包含您在使用 System.out.println
尝试时看到的文本。
我已经复制了您的输出示例,使用记事本将其粘贴到新文件中,保存后,使用十六进制编辑器(此处为 HxD)查看了该文件。十六进制数据的开头如下:FF FE 41 3A 20 31 35 42...,它“翻译”为 ÿþA: 15B...
。这正是您的预期结果加上记事本在保存文件时创建的 BOM(字节顺序标记),因此不是原始数据的一部分。
那么为什么你会看到奇怪的结果呢?原因不是您的程序,而是您正在使用的文本查看器。其中许多尝试对文件是否缺少 BOM 进行有根据的猜测,以决定(在 Windows 记事本的情况下)是否应使用 cp1252 (Windows Latin-1)、UTF-8 或 Unicode/UTF-16 读取文件。有不同的算法,因此很难说为什么您的查看者认为这可能是 UTF-16,但事实就是如此;-)
我有一个猜测,解决你的问题可能是改变
fw.write(((char)(i + 'A')) + ": " + count[i]);
至
fw.write(((char)(i + 'A')) + ": " + count[i] + "\r\n");
或者使用包含 BOM 的字符集写入文件,例如UTF-8 或 UTF-16。使用 Java 11,您可以直接使用 FileWriter
来完成此操作(有一个新的构造函数可以进行设置),如果您必须使用旧版本的 Java,则需要使用 OutputStreamWriter
:
OutputStreamWriter fw = new OutputStreamWriter(new FileOutputStream(file2), "UTF8");
另外:检查您的文本查看器,“打开文件”对话框是否允许您显式指定字符集,德国 Windows 系统上的记事本调用选项“Codierung”,而“ANSI”是“cp1252”(您的 Java 的字符集)使用FileWriter
(没有特定字符集)时应该使用虚拟机。
关于java - FileWriter 不知怎的用中文写,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58510484/
这个问题在这里已经有了答案: How to get all enum values in Java? (8 个回答) 关闭5年前。 我想创建一个 JComboBox 来处理选择给它的任何 Enum。为
我是一名优秀的程序员,十分优秀!