gpt4 book ai didi

c - 如何正确识别C中的不同行尾?

转载 作者:行者123 更新时间:2023-12-03 22:54:07 24 4
gpt4 key购买 nike

我想标题不言自明。

我正在 Windows 7 上编写一个 C 程序,使用 g++ 和 Notepad++,它比较文件的内容。

文件内容:

simple
file with lines

文件以 Windows 风格的 CRLF 结尾。

当我使用此代码计算文件长度时:
fseek(file, 0, SEEK_END);
size = ftell(file);
fseek(file, 0, SEEK_SET);

我得到 23。

当我将行尾更改为 Unix 格式 LF(使用 Notepad++)时,长度为 22。

在比较两个文件时,这会产生一些问题。这就是为什么我问,是否有办法确定给定文件是否具有 LF 或 CR 或 CRLF。

我知道我可以区分 CR 和 LF,LF 的 ascii 代码为 10,CR 的 ascii 代码为 13。或者 LF 是 '\n' 而 CR 是 '\r'。

但是当一个接一个地读取文件时,我总是得到 LF (ascii 10),即使有 CRLF。

我希望我说清楚了。谢谢。

最佳答案

这就是以文本和二进制模式读取文件的区别。

在文本模式下(带有相关参数的 fopen fopen( file, "r") 然后是 getc 等)所有行尾都被读取为一个字符。如果您以二进制模式阅读,例如fopen(file, "rb")然后你会得到实际的字节,你会看到 CRLF 和 CR 不同。 fseek 将使用实际字节数,因此会看到行尾的差异。

唯一的判断方法是以两种不同的方式读取文件,看看是否有 CRLF 对或大小不同,或者实际上只是看看是否有 LF,因为我认为当前的任何主要操作系统都没有使用它作为线enfing。

关于c - 如何正确识别C中的不同行尾?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13108405/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com