gpt4 book ai didi

java - 帮助我阅读从大型机中提取的这个 ANSI 文件

转载 作者:行者123 更新时间:2023-11-30 06:36:04 24 4
gpt4 key购买 nike

http://www.2shared.com/document/VqlJ-1wF/test.html

1) 这个文件的编码是什么?2) 用 Ja​​va 阅读本文的最佳方式是什么?

目前我有

Scanner scanner = new Scanner(new File("test.txt"), "IBM850");
while (scanner.hasNextLine()) {
buffer = new StringBuffer(scanner.nextLine());
System.out.println("BUFFER = "+buffer.toString());
}

打印大量空值和垃圾。我需要使用的正确编码是什么?

最佳答案

我在 PC 和 IBM 中端系统之间移动数据方面拥有丰富的经验。我可以看出该文件绝对不是(纯)EBCDIC。每“行”的开头是 ASCII 字符:

CODE12312345678901502G830918

任何 EBCDIC 字符匹配该序列的可能性,更不用说所有三行上的相同序列是无限小的。

我最好的选择是使用二进制数据的 ASCII 前导(或已翻译的 EBCDIC)。如果已翻译,则二进制部分几乎肯定已损坏。

在我用十六进制检查后不久,我可能会得到更多信息。

每条“记录”之间用十六进制0D 0A 0D 0A分隔,是一对CRLF序列。

我认为您很可能拥有固定字段平面文件格式,其中文本字段为 ASCII,其他字段为二进制。

关于java - 帮助我阅读从大型机中提取的这个 ANSI 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5236202/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com