如何正确识别C中的不同行结尾?

Hor*_*yze 5 c ascii lf line-endings

我想标题本身就说明了一切。

我正在 Windows 7 上使用 g++ 和 Notepad++ 编写一个 C 程序,它比较文件的内容。

文件内容:

simple
file with lines
Run Code Online (Sandbox Code Playgroud)

文件具有 Windows 样式 CRLF 的行结尾。

当我使用以下代码计算文件长度时:

fseek(file, 0, SEEK_END);
size = ftell(file);
fseek(file, 0, SEEK_SET);
Run Code Online (Sandbox Code Playgroud)

我得到23

当我将行结尾更改为 Unix 格式 LF(使用 Notepad++)时,我得到22长度。

在比较两个文件时,这会产生某种问题。这就是为什么我问,是否有办法确定给定文件是否有 LF、CR 或 CRLF。

我知道我可以区分CR和LF,LF有ascii代码10,CR有ascii代码13。或者LF是'\n'而CR是'\r'。

但是当一个字符一个字符地读取文件时,即使有 CRLF,我总是得到 LF (ascii 10)。

我希望我说清楚了。谢谢。

use*_*019 4

这就是以文本模式和二进制模式读取文件的区别。

在文本模式下(fopen 带有相关参数fopen( file, "r") ,然后 getc 等)所有行结束都被读取为一个字符。如果您以二进制模式读取,例如,fopen(file, "rb")您将获得实际字节,并且您将看到 CRLF 和 CR 不同。fseek 将使用实际的字节数,因此会看到行结尾的差异。

唯一的判断方法是以两种不同的方式读取文件,看看是否有 CRLF 对或大小不同,或者实际上只是看看是否有 LF,因为我不认为当前任何主要操作系统都使用它作为一条线。