Hor*_*yze 5 c ascii lf line-endings
我想标题本身就说明了一切。
我正在 Windows 7 上使用 g++ 和 Notepad++ 编写一个 C 程序,它比较文件的内容。
文件内容:
simple
file with lines
Run Code Online (Sandbox Code Playgroud)
文件具有 Windows 样式 CRLF 的行结尾。
当我使用以下代码计算文件长度时:
fseek(file, 0, SEEK_END);
size = ftell(file);
fseek(file, 0, SEEK_SET);
Run Code Online (Sandbox Code Playgroud)
我得到23。
当我将行结尾更改为 Unix 格式 LF(使用 Notepad++)时,我得到22长度。
在比较两个文件时,这会产生某种问题。这就是为什么我问,是否有办法确定给定文件是否有 LF、CR 或 CRLF。
我知道我可以区分CR和LF,LF有ascii代码10,CR有ascii代码13。或者LF是'\n'而CR是'\r'。
但是当一个字符一个字符地读取文件时,即使有 CRLF,我总是得到 LF (ascii 10)。
我希望我说清楚了。谢谢。
这就是以文本模式和二进制模式读取文件的区别。
在文本模式下(fopen 带有相关参数fopen( file, "r") ,然后 getc 等)所有行结束都被读取为一个字符。如果您以二进制模式读取,例如,fopen(file, "rb")您将获得实际字节,并且您将看到 CRLF 和 CR 不同。fseek 将使用实际的字节数,因此会看到行结尾的差异。
唯一的判断方法是以两种不同的方式读取文件,看看是否有 CRLF 对或大小不同,或者实际上只是看看是否有 LF,因为我不认为当前任何主要操作系统都使用它作为一条线。