需要帮助理解Microsoft对File.ReadLines和File.ReadAllLines的解释

Piu*_*ush 3 c# readlines file.readalllines

根据Microsoft对The ReadLinesReadAllLinesmethods 的解释,当您使用时ReadLines,您可以在返回整个集合之前开始枚举字符串集合.使用时ReadAllLines,必须等待返回整个字符串数组,然后才能访问该数组.因此,当您使用非常大的文件时,ReadLines可以更高效.

当他们说:

1 - "当你使用ReadLines时,你可以在返回整个集合之前开始枚举字符串集合. "如果编写下面的代码行,那么这不意味着ReadLines方法执行结束并且整个集合是返回并存储在变量filedata中?

IEnumerable<String> filedata = File.ReadLines(fileWithPath)
Run Code Online (Sandbox Code Playgroud)

2 - "当你使用时ReadAllLines,你必须等待返回整个字符串数组才能访问数组 ".这是否意味着,在下面的代码片段中,如果读取一个大文件,那么如果在读取文件后立即使用数组变量hugeFileData将不会拥有所有数据?

string[] hugeFileData = File.ReadAllLines(path)
string i = hugeFileData[hugeFileData.length-1];
Run Code Online (Sandbox Code Playgroud)

3 - "当您使用非常大的文件时,ReadLines可以更高效 ".如果是这样,那么在读取大文件时,以下代码是否有效?我相信第二行和第三行下面的代码会读取文件两次,如果我错了,请纠正我.

string fileWithPath = "some large sized file path";
string lastLine = File.ReadLines(fileWithPath).Last();
int totalLines = File.ReadLines(fileWithPath).Count();
Run Code Online (Sandbox Code Playgroud)

在上面的代码片段中两次在同一文件上调用ReadLines的原因是当我尝试下面的代码时,我TextReader在下面的代码片段的第3行上得到了一个异常"无法从关闭状态读取".

IEnumerable<String> filedata = File.ReadLines(fileWithPath);
string lastLine = filedata.Last();
int totalLines = filedata.Count();
Run Code Online (Sandbox Code Playgroud)

Jim*_*hel 7

之间的差ReadLinesReadAllLines容易被代码示出.

如果你这样写:

foreach (var line in File.ReadLines(filename))
{
    Console.WriteLine(line);
}
Run Code Online (Sandbox Code Playgroud)

发生的事情类似于:

using (var reader = new StreamReader(filename))
{
    while (!reader.EndOfStream)
    {
        var line = reader.ReadLine();
        Console.WriteLine(line);
    }
}
Run Code Online (Sandbox Code Playgroud)

生成的实际代码稍微复杂一些(ReadLines返回一个枚举器,其MoveNext方法读取并返回每一行),但从外部来看,行为类似.

这种行为的关键是延迟执行,你应该很好地理解它以便充分利用LINQ.所以你的第一个问题的答案是"不".所有调用ReadLines都是打开文件并返回一个枚举器.在您要求之前,它不会读取第一行.

请注意,代码可以在第二行被读取之前输出第一行.此外,您一次只能使用一行内存.

ReadAllLines有很多不同的行为.当你写:

foreach (var line in File.ReadAllLines(filename))
{
    Console.WriteLine(line);
}
Run Code Online (Sandbox Code Playgroud)

实际发生的事情更像是这样:

List<string> lines = new List<string>();
using (var reader = new StreamReader(filename))
{
    while (!reader.EndOfStream)
    {
        var line = reader.ReadLine();
        lines.Add(line);
    }
}
foreach (var line in lines)
{
    Console.WriteLine(line);
}
Run Code Online (Sandbox Code Playgroud)

这里,程序必须先将整个文件加载到内存中,然后才能输出第一行.

你使用哪一个取决于你想做什么.如果您只需要逐行访问文件,那么ReadLines通常是更好的选择 - 特别是对于大文件.但是如果你想随机访问行或者你将多次读取文件,那么ReadAllLines可能会更好.但是,请记住,ReadAllLines要求您有足够的内存来容纳整个文件.

在第三个问题中,您展示了此代码,该代码在最后一行产生了异常:

IEnumerable<String> filedata = File.ReadLines(fileWithPath);
string lastLine = filedata.Last();
int totalLines = filedata.Count();
Run Code Online (Sandbox Code Playgroud)

这里发生的是第一行返回了一个枚举器.第二行代码枚举整个序列(即读到文件的末尾),以便它可以找到最后一行.枚举器看到它在文件末尾并关闭了相关的阅读器.最后一行代码再次尝试枚举该文件,但该文件已经关闭.返回的枚举器中没有"重置到文件的开头"功能ReadLines.