gpt4 book ai didi

java - java中的文件名字符集问题

转载 作者:塔克拉玛干 更新时间:2023-11-03 05:23:22 25 4
gpt4 key购买 nike

当文件名带有重音符号时,尝试打开一个文件时提示找不到,因为字符集不匹配。我在 linux 系统上使用 UTF-8(/etc/locales 也设置 UTF-8)。使用 -Dfile.encoding=UTF-8 和环境变量 JBOSS_ENCODING="UTF-8"运行 jboss

使用 JSP,我得到文件的名称:

String fileName = element.getChildText("FileName");
out.println("File to be opened : " + filename);

显示:

要打开的文件:aaaaaà.txt

但是,new File(fileName) 将不起作用。只是 file.exists() 是错误的。

试图:

File[] files = dir.listFiles();
for (int i=0; i<files.length; i++){
out.println(fileName);

我得到:aaaaaà .txt

为什么读取并尝试打开硬盘中的文件为 ISO-8859-1 的文件?它是 JBoss 配置吗?一个java配置?我如何强制 java.io.File 读取使用 UTF-8 作为文件名字符集的文件?

我使用过其他工具,使用 UTF-8 时,名称始终可以正常读取。

(注意我总是在谈论文件的名称,而不是内容,它可能是一个空文件)

最佳答案

我正在尝试找出问题所在。这是我已有的:

Exists.java:

import java.io.*;

public class Exists {
public static void main(String[] args) {
new File("aaa").exists();
new File("aaa\u00E4").exists();
new File("aaa\u00C3\u00A4").exists();
}
}

还有java -version:

java version "1.6.0_20"
Java(TM) SE Runtime Environment (build 1.6.0_20-b02)
Java HotSpot(TM) 64-Bit Server VM (build 16.3-b01, mixed mode)

现在进入有趣的部分:

$ strace -f -o strace.out java Exists && grep 'stat("aaa' strace.out
31942 stat("aaa", 0x41464950) = -1 ENOENT (No such file or directory)
31942 stat("aaa\303\244", 0x41464950) = -1 ENOENT (No such file or directory)
31942 stat("aaa\303\203\302\244", 0x41464950) = -1 ENOENT (No such file or directory)

strace 的好处是在字节级别上工作,而不是像 Java 那样在字符级别上工作。所以在这种情况下一切正常。我将环境变量 LANG 设置为 en_US.UTF-8,所有 LC_* 变量都未设置。

现在将问题追踪到一个最小的工作示例:

$ strace -f -o strace.out env - LC_ALL=en_US.UTF-8 /home/roland/bin/java Exists && grep 'stat("aaa' strace.out
31968 stat("aaa", 0x41a75950) = -1 ENOENT (No such file or directory)
31968 stat("aaa\303\244", 0x41a75950) = -1 ENOENT (No such file or directory)
31968 stat("aaa\303\203\302\244", 0x41a75950) = -1 ENOENT (No such file or directory)

这仍然有效。那么让我们尝试另一种编码:

$ strace -f -o strace.out env - LANG=en_US.ISO-8859-1 /home/roland/bin/java Exists && grep 'stat("aaa' strace.out
32070 stat("aaa", 0x407a3950) = -1 ENOENT (No such file or directory)
32070 stat("aaa?", 0x407a3950) = -1 ENOENT (No such file or directory)
32070 stat("aaa??", 0x407a3950) = -1 ENOENT (No such file or directory)

所以这行不通。一个可能的原因可能是我选择的语言环境不在 locale -a 打印的列表中。但这不应该成为 Java 将字母转换为问号的原因。

一旦 LANG 指向不存在的语言环境,sun.jnu.encoding 属性的设置就不再起作用。所以我现在没主意了。

关于java - java中的文件名字符集问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3832761/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com