java - 在 Windows 上读取文件但在 Linux 容器上不读取？-6ren

java - 在 Windows 上读取文件但在 Linux 容器上不读取？

转载作者：行者123 更新时间：2023-12-01 14:13:08

就像标题说的那样，在 linux 容器上运行相同的代码时，我无法读取文件(csv 文件)的内容

private Set<VehicleConfiguration> loadConfigurations(Path file, CodeType codeType) throws IOException {

    log.debug("File exists? " + Files.exists(file));
    log.debug("Path " + file.toString());
    log.debug("File " + file.toFile().toString());
    log.debug("File absolute path " + file.toAbsolutePath().toString());

    String line;
    Set<VehicleConfiguration> configurations = new HashSet<>(); // this way we ignore duplicates in the same file
    try(BufferedReader br = new BufferedReader(new FileReader(file.toFile()))){
        while ((line = br.readLine()) != null)   {
            configurations.add(build(line, codeType));
        }
    }


    log.debug("Loaded " + configurations.size() + " configurations");
    return configurations;
}

日志返回“true”和两个系统中的文件路径(本地在 windows 和 linux docker 容器上)。在 Windows 上它加载“15185 配置”，但在容器上它加载“0 配置”。
该文件存在于linux上，我使用bash并自己检查。我使用 head 命令并且文件有行。
在此之前，我尝试使用 Files.lines，如下所示:

var vehicleConfigurations = Files.lines(file)
            .map(line -> build(line, codeType))
            .collect(Collectors.toCollection(HashSet::new));

但这有一个关于内容的问题(仅在容器上)。它读取文件而不是整个文件，它到达给定的行(例如第 8000 行)并且没有完全读取它(在逗号分隔符之前读取大约半行)。然后我得到一个 java.lang.ArrayIndexOutOfBoundsException 因为我的构建方法试图拆分然后行并且我访问索引 1(它没有，只有 0):

private VehicleConfiguration build(String line, CodeType codeType) {
    String[] cells = line.split(lineSeparator);
    var vc = new VehicleConfiguration();
    vc.setVin(cells[0]);
    vc.setCode(cells[1]);
    vc.setType(codeType);
    return vc;
}

可能是什么问题？我不明白相同的代码(在 Java 中)如何在 Windows 上工作，但在 Linux 容器上却不行。这没有道理。
我正在使用 Java 11。使用 docker-compose 文件中的卷复制该文件，如下所示:

    volumes:
  - ./file-sources:/file-sources

然后我将文件(在 linux 容器上使用 cp 命令)从文件源复制到/root，因为这是应用程序正在监听新文件到达的地方。然后使用我描述的方法读取文件内容。示例文件数据(没有奇怪的字符):

提前致谢。
更新:尝试使用 newBufferedReader 方法，结果相同(适用于 Windows，不适用于 linux 容器):

  private Set<VehicleConfiguration> loadConfigurations(Path file, CodeType codeType) throws IOException {
    String line;
    Set<VehicleConfiguration> configurations = new HashSet<>(); // this way we ignore duplicates in the same file
    try(BufferedReader br = Files.newBufferedReader(file)){
        while ((line = br.readLine()) != null)   {
            configurations.add(build(line, codeType));
        }
    }

    log.debug("Loaded " + configurations.size() + " configurations");
    return configurations;
}

linux 容器中的 wc -l(在/root 中)返回:15185 hard_001.csv
更新:这不是解决方案，但我发现通过将文件直接放在文件源文件夹中并使该文件夹成为代码监听的文件夹，文件被读取。所以基本上，在容器内使用 cp/mv 到另一个文件夹时，问题似乎更加明显。也许文件在完全复制/移动之前被读取，这就是它读取 0 个配置的原因？

最佳答案

java中有一些你永远不应该使用的方法。曾经。new FileReader(File)是其中之一。
任何时候你有一个东西代表字节并且以某种方式出现字符或字符串，反之亦然？永远不要使用这些，除非所述方法的规范明确指出它总是使用预设的字符集。几乎所有此类方法都使用“系统默认字符集”，这意味着该操作取决于您运行它的机器。这是“这将失败，您的测试无法捕捉到它”的简写。你不想要的。
这就是为什么你永远不应该使用这些东西。
FileReader 已被修复(有第二个构造函数接受一个字符集)，但这只是从 JDK11 开始。您已经有了不错的新 API，为什么要切换回极旧的 File API？不要那样做。
Files中的所有各种方法，例如Files.newBufferedReader , 如果您不指定，则指定执行 UTF-8(这样，Files 更有用，并且与大多数其他 java 核心库不同)。因此:

try (BufferedReader br = Files.newBufferedReader(file)) {

这只是..比你的线更好。
现在，它可能仍然会失败。但这很好!它会还有在您的开发机器上失败。实际上，您正在阅读的文件很可能不是 UTF_8 格式的。这是可能的猜测；大多数 linuxen 使用 UTF_8 默认字符集部署，而大多数开发机器没有；如果您的开发机器正在工作而您的部署环境没有，那么明显的结论是您的输入文件不是 UTF_8。它也不需要是您的开发机器的默认设置；像 ISO_8859_1 这样的东西永远不会抛出异常，但它会改为读取 gobbledygook。您的代码似乎可以工作(没有崩溃)，但您阅读的文本仍然不正确。
找出你得到的文本编码，然后指定它。如果是 ISO_8859_1，例如:

try (BufferedReader br = Files.newBufferedReader(file, StandardCharsets.ISO_8859_1)) {

现在您的代码不再具有“适用于某些机器但不适用于其他机器”的性质。
如果必须，请在十六进制编辑器中检查失败的行。我敢打赌， donut 里会有一个 0x80 或更高的字节(十进制，128 或更高)。在各种文本编码中，从 ASCII 到任何 ISO-8859 变体到 UTF-8 Windows Cp1252 到 macroman 再到许多其他东西，直到并包括 127 在内的所有内容往往意味着完全相同的东西，只要它只是纯字母和数字，编码错误不会有任何区别。但是一旦你达到 0x80 或更高，它们就完全不同了。有了那个字节+对它应该是什么字符的一些知识，通常是弄清楚该文本文件的编码是什么的一个好的开始。
注意:如果不是这样，请检查文本文件是如何从您的开发机器复制到您的部署环境的。你确定是同一个文件？如果它是通过文 native 制复制的，那么字符集编码又可能是罪魁祸首，但这一次是文件的写入方式，而不是你的 java 应用程序读取它的方式。

关于java - 在 Windows 上读取文件但在 Linux 容器上不读取？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/63291140/

文章推荐： java - 为什么这段代码特别出现 3 个错误？

文章推荐： java - 如何在java中播放.wav文件而不出现游戏延迟

文章推荐： java - 使用 JButton 的无锁循环

文章推荐： java - 如何在java中获取启动jnlp文件名/目录？

linux - 远程文本编辑 : Linux to Linux
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的，
linux - Linux 管道缓冲区有多少数据？ linux 管道缓冲区大小可以配置吗？
Linux 管道可以缓冲多少数据？这是可配置的吗？如果管道的两端在同一个进程中，但线程不同，这会有什么不同吗？请注意:这个“同一个进程，两个线程”的问题是理论上的边栏，真正的问题是关于缓冲的。最
linux - 用 Linux 启动 Linux？
我找到了here [最后一页] 一种有趣的通过 Linux 启动 Linux 的方法。不幸的是，它只是被提及，我在网上找不到任何有用的链接。那么有人听说过一种避免引导加载程序而使用 Linux 的方法
linux - linux 内核、linux 设备驱动程序或模块编写器程序员是否需要算法分析？
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开，visit the help center . 关闭 1
linux - Linux ld-linux.so 的版本化符号
我试图了解 ld-linux.so 如何在 Linux 上解析对版本化符号的引用。我有以下文件: 测试.c: void f(); int main() { f(); } a.c 和 b.c:
linux - Linux 桌面应用程序可以用作 Linux 桌面吗？
与 RetroPie 的工作原理类似，我可以使用 Linux 应用程序作为我的桌面环境吗？我实际上并不需要像实际桌面和安装应用程序这样的东西。我只需要一种干净简单的方法来在 RaspberryPi 上
linux - linux 上用户和 linux 系统范围内的打开文件数是多少？
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。这个问题似乎不是关于 a specific programming problem, a softwar
linux - 亚马逊 Linux 与红帽 Linux
关闭。这个问题是off-topic .它目前不接受答案。想改进这个问题吗？ Update the question所以它是on-topic用于堆栈溢出。关闭 10 年前。 Improve thi
linux - 在 Linux (Linux mint) 中创建您自己的定制应用程序软件中心的最佳方法是什么？
有什么方法可以覆盖现有的源代码，我应该用 PyQt、PyGTK、Java 等从头开始构建吗？最佳答案如果您指的是软件本身而不是它所连接的存储库，那么自定义应用程序的方法就是 fork 项目。据我所
linux - 如何通过一个磁盘中的另一个 linux 系统更新一个 linux 系统？
我的情况是:我在一个磁盘上安装了两个 linux。我将第一个安装在/dev/sda1 中，然后在/dev/sda2 中安装第二个然后我运行第一个系统，我写了一个脚本来在第一个系统运行时更新它。
linux - 如何让 linux 驱动程序在 linux 内核加载后检测和使用设备？
我在 i2c-0 总线上使用地址为 0x3f 的系统监视器设备。该设备在设备树中配置有 pmbus 驱动程序。问题是，加载 linux 内核时，这个“Sysmon”设备没有供电。因此，当我在总线 0
linux - 在旧 Linux 版本中构建的应用程序可以在最新 Linux 中运行吗？
关闭。这个问题是off-topic .它目前不接受答案。想改进这个问题吗？ Update the question所以它是on-topic用于堆栈溢出。关闭 11 年前。 Improve thi
linux - 将 linux 内核中的函数导出到 linux 模块
我正试图在 linux 模块中分配一大块内存，而 kalloc 做不到。我知道唯一的方法是使用 alloc_bootmem(unsigned long size) 但我只能从 linux 内核而不是
linux - 我如何连接到一个简单的 linux 控制台来执行一些任何人都可以使用 linux 操作系统的基本命令？
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。这个问题似乎不是关于 a specific programming problem, a softwar
linux - "pwd"命令适用于所有 linux 类型的 linux？
我有 .sh 文件来运行应用程序。在该文件中，我想动态设置服务器名称，而不是每次都配置。我尝试了以下方法，它在 CentOS 中运行良好。 nohup /voip/java/jdk1.8.0_71/
linux - 将 Linux 应用程序复制到另一个 Linux 操作系统
我是在 Linux 上开发嵌入式 C++ 程序的新手。我有我的 Debian 操作系统，我在其中开发和编译了我的 C++ 项目(一个简单的控制台进程)。我想将我的应用程序放到另一个 Debian 操
linux - 如何从 Linux 向 Linux 机器发送数据或文件？
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 4 年前。 Improve this ques
linux - 在 Linux 内核源代码树中哪里可以找到 Linux Logo ？
我使用4.19.78版本的稳定内核，我想找到带有企鹅二进制数据的C数组。系统启动时显示。我需要在哪里搜索该内容？我在 include/linux/linux_logo.h 文件中只找到了一些 Log
linux - 是否可以从非 linux 系统远程调试 linux 代码？
我知道可以使用 gdb 的服务器模式远程调试代码，我知道可以调试针对另一种架构交叉编译的代码，但是是否可以更进一步，从远程调试 Linux 应用程序OS X 使用 gdbserver？最佳答案当然
linux - 从一个 linux 到另一个 linux 的二进制文件
是否有任何可能的方法来运行在另一个 Linux 上编译的二进制文件？我知道当然最简单的是在另一台机器上重建它，但假设我们唯一能得到的是一个二进制文件，那么这可能与否？ (我知道这可能并不容易，但我只是

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

java - 在 Windows 上读取文件但在 Linux 容器上不读取？