java - 从文本文件读取时如何维护 EOL 字符？-6ren

java - 从文本文件读取时如何维护 EOL 字符？

转载作者：行者123 更新时间：2023-12-01 21:34:23

26

4

BufferedReader.readLine() 会自动删除 EOL 字符，我不能简单地执行 readLine()，然后在其末尾添加“\r”。我试过了

InputStream myFile = new FileInputStream("C:\\test.txt");
StringBuilder sb = new StringBuilder();

int i;

while((i = myFile.read()) != -1)
{
    char ch = (char) i;
    sb.append(ch);
}

System.out.println(sb);

但是“char ch = (char) i”会丢失字节数据，因为 int 为 4 个字节，而 char 为 2 个字节。

我再说一遍，我不能做这样的事情

sb.append(ch+"\r");

因为此通用代码将读取的某些文件将包含 CR，而其他文件则不会。

从 java.nio.* 中，Files.readAllBytes(Path path) 似乎是一个选项。但我对它不熟悉，无法判断它是否返回 EOL 字符或不基于 Javadoc

最佳答案

理想情况下，您不要触及字节。例如

public static String fromFile(File file, Charset charset) throws IOException {
    try (BufferedReader reader = new BufferedReader(new InputStreamReader(new FileInputStream(file), charset))) {
        StringWriter out = new StringWriter();
        char[] cbuf = new char[8192];
        int read;
        while ((read = reader.read(cbuf)) != -1) {
            out.write(cbuf, 0, read);
        }
        return out.toString();
    }
}

将所有内容直接转换为单个字符串。将 byte 转换为 char 确实很危险，您不应该尝试自己这样做，除非您知道它只是 ascii。让内置字符集来做这件事。使用正确的方法已经够棘手的了。

Files.readAllBytes() 确实返回 EOL 字符，因为它处理字节，并且不会尝试解释这些字节的含义。

public static String fromPath(Path path, Charset charset) throws IOException {
    byte[] bytes = Files.readAllBytes(path);
    return new String(bytes, 0, bytes.length, charset);
}

相当于使用 nio 方法。使用 Paths.get("myfile.txt") 调用，而不是使用 new File("myfile.txt")。

关于java - 从文本文件读取时如何维护 EOL 字符？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/37079283/

26

4

0

文章推荐： java - 无法在 IntelliJ IDEA 中导入 javax.validation.constraints

文章推荐： r - R中如何获取行索引号？

文章推荐： java - 静态最终变量在重建后具有旧值

文章推荐： Java 不允许我使用多个 else 语句

git - .gitattributes 中的 "* text=auto eol=lf"和 "* text eol=lf"有什么区别？
这与这个问题非常相似: What is the differrence between `* text=auto` and `* text eol=lf` in .gitattributes? 但我特
notepad++ - 一次性更改多个文件的 EOL
Notepad++(甚至使用其他工具)是否有任何方法可以一次性在多个文件上自动更改行结尾？即将 Windows EOL (CRLF) 和 UNIX EOL (LF) 文件的混合转换为所有 Windo
java - 根据设置更改字符串中的 EOL
我正在尝试根据设置更改字符串的行结尾。基本上我有字符串，大多以 LF 结尾，很少有其他东西，但它会发生，并且我希望能够将它们更改为 CRLF 或 CR(如果被要求)，或者确保它们是纯粹的 LF(如果被
PHP代码显示不正确[一行] EOL
当我尝试在我的服务器上上传一个 php 文件时，我收到一条消息:"Parse error: ..." 我知道这是什么意思，但问题是别的。如果我在本地服务器上编辑文件(我的计算机上安装了 XAMPP)
扫描字符串文字时的 Python EOL
我正在尝试创建一个输出文件以在类项目中使用，但在扫描此行上的字符串文字时它不断给出 EOL: outfile = open(r'C:\Users\kay\Documents\CCA Classes\C
python - 扫描字符串文字时 EOL
这是我的代码并收到以下错误消息:第 8 行 sepFile=readFile.read().split('\')SyntaxError:扫描字符串文字时 EOL你可以帮帮我吗？谢谢。 import m
python - 删除文件中的多个 EOL
我有一个包含\n EOL 字符的制表符分隔文件，看起来像这样: User Name\tCode\tTrack\tColor\tNote\n\nUser Name2\tCode2\tTrack2\tCo
python - 扫描字符串文字错误时 EOL
所以我正在尝试使用这段代码我收到错误 SyntaxError: EOL while scanning string literal 代码: def clean_tweet(self, tweet):
python - 即使在关闭时也扫描字符串文字时 EOL
在路径= bla bla行上，它在扫描字符串文字时显示EOL，即使它是用“”关闭的，我在我的代码中经常发生这种情况，这真的很烦人，因为我永远无法修复它。 import os import shutil
c# - EOL 特殊字符不匹配
我试图在输入字符串中找到每个“a -> b, c, d”模式。我使用的模式如下: "^[ \t]*(\\w+)[ \t]*->[ \t]*(\\w+)((?:,[ \t]*\\w+)*)$" 这个模式
javascript - 错误的 EOL 转义
我正在尝试使用简单的所见即所得编辑器。 JSLint 表示它有“Bad escapeing of EOL”。由于我是 javascript 的新手，我很难弄清楚它的含义，因为我正在使用在线找到的代码。
java - 高效更改字符串中的 EOL 字符
我正在为 Android 编写一个网络应用程序。根据协议(protocol)规范，每行的结尾必须是 CR/LF 组合。虽然我用自己的字符串生成它没有问题，但有时我必须处理用户输入并转换行尾。我在内部
Oracle Weblogic EOL 版本
这个问题应该由 Oracle 支持人员在技术上回答，但他们的响应时间很慢。因此，我想问一下，是否有版本指南提到哪些版本的 Oracle Weblogic 已停产及其日期？ http://www.ora
java - 从文本文件读取时如何维护 EOL 字符？
BufferedReader.readLine() 会自动删除 EOL 字符，我不能简单地执行 readLine()，然后在其末尾添加“\r”。我试过了 InputStream myFile = ne
python - 为什么出现 EOL 错误以及它的含义是什么？
在扫描字符串文字时，它不断出现EOL，但这是什么意思？这是它不断调用错误的部分: if health2 <= 3: print ("With all the strength you have
Python:寻求文件中的 EOL 不起作用
我有这个方法: def get_chunksize(path): """ Breaks a file into chunks and yields the chunk sizes.
python - readlines() 在行的末尾没有 EOL
这个问题在这里已经有了答案: Remove the newline character in a list read from a file [duplicate] (5 个答案) 关闭 8 年前。
c - fgets 不读 EOL？
基本上我正在用 C 语言编写一个基于文本的角色扮演游戏，我想创建一个 map 系统。基本上，我遇到问题的功能是从如下所示的文件中读取“文本映射”: ----------\n |c x [\n
C# 确定平面文件中的 EOL 字符
我正在尝试从给定的 .txt 或 .csv 平面文件中识别 EOL 字符是什么。根据平面文件中第一行数据的 EOL 字符是什么，我想相应地处理该文件中的数据(我正在使用批量加载在 SQL Server
python - EOL 在计算字段上停止 python
有人可以帮我修改这些脚本以忽略错误并继续运行吗？我只需要弄清楚如何使脚本跳过这些错误并完成其余的行。这是完整的 Python 脚本: # Import system modules import s

首页

博学

6Ren·AI

商城

java - 从文本文件读取时如何维护 EOL 字符？