Jon*_*röm 5 c# generics ienumerable
在实现这种通用的合并排序时,作为一种Code Kata,我偶然发现了IEnumerable和List之间的差异,我需要帮助弄清楚.
这是MergeSort
public class MergeSort<T>
{
public IEnumerable<T> Sort(IEnumerable<T> arr)
{
if (arr.Count() <= 1) return arr;
int middle = arr.Count() / 2;
var left = arr.Take(middle).ToList();
var right = arr.Skip(middle).ToList();
return Merge(Sort(left), Sort(right));
}
private static IEnumerable<T> Merge(IEnumerable<T> left, IEnumerable<T> right)
{
var arrSorted = new List<T>();
while (left.Count() > 0 && right.Count() > 0)
{
if (Comparer<T>.Default.Compare(left.First(), right.First()) < 0)
{
arrSorted.Add(left.First());
left=left.Skip(1);
}
else
{
arrSorted.Add(right.First());
right=right.Skip(1);
}
}
return arrSorted.Concat(left).Concat(right);
}
}
Run Code Online (Sandbox Code Playgroud)
如果我删除.ToList()
on left
和right
变量,则无法正确排序.你明白为什么吗?
例
var ints = new List<int> { 5, 8, 2, 1, 7 };
var mergeSortInt = new MergeSort<int>();
var sortedInts = mergeSortInt.Sort(ints);
Run Code Online (Sandbox Code Playgroud)
同 .ToList()
[0]: 1 [1]: 2 [2]: 5 [3]: 7 [4]: 8
没有 .ToList()
[0]: 1 [1]: 2 [2]: 5 [3]: 7 [4]: 2
编辑
这是我的愚蠢测试让我.
我测试了这样:
var sortedInts = mergeSortInt.Sort(ints);
ints.Sort();
if (Enumerable.SequenceEqual(ints, sortedInts)) Console.WriteLine("ints sorts ok");
Run Code Online (Sandbox Code Playgroud)
只需将第一行更改为
var sortedInts = mergeSortInt.Sort(ints).ToList();
Run Code Online (Sandbox Code Playgroud)
删除问题(和懒惰的评估).
编辑2010-12-29
我想我会弄清楚懒惰的评价是如何在这里弄乱的,但我只是不明白.
.ToList()
像这样删除上面的Sort方法中的
var left = arr.Take(middle);
var right = arr.Skip(middle);
Run Code Online (Sandbox Code Playgroud)
然后尝试这个
var ints = new List<int> { 5, 8, 2 };
var mergeSortInt = new MergeSort<int>();
var sortedInts = mergeSortInt.Sort(ints);
ints.Sort();
if (Enumerable.SequenceEqual(ints, sortedInts)) Console.WriteLine("ints sorts ok");
Run Code Online (Sandbox Code Playgroud)
调试时可以看到,前ints.Sort()
一个sortedInts.ToList()
返回
[0]: 2
[1]: 5
[2]: 8
Run Code Online (Sandbox Code Playgroud)
但在ints.Sort()
它返回后
[0]: 2
[1]: 5
[2]: 5
Run Code Online (Sandbox Code Playgroud)
这里到底发生了什么?
您的功能是正确的 - 如果您检查结果Merge
,您将看到结果已排序(示例).
那么问题出在哪里?正如您所怀疑的那样,您正在测试它是错误的 - 当您调用Sort
原始列表时,您将更改从中获取的所有集合!
这是一段演示您所做的事情的片段:
List<int> numbers = new List<int> {5, 4};
IEnumerable<int> first = numbers.Take(1);
Console.WriteLine(first.Single()); //prints 5
numbers.Sort();
Console.WriteLine(first.Single()); //prints 4!
Run Code Online (Sandbox Code Playgroud)
你创建的所有集合基本上都是相同的first
- 在某种程度上,它们是指向位置的惰性指针ints
.显然,当你打电话时ToList
,问题就消除了.
你的情况比这更复杂.你Sort
的部分是懒惰的,完全按照你的建议:首先你创建一个list(arrSorted
)并为它添加整数.那部分不是懒惰的,这也是你看到前几个元素排序的原因.接下来,添加其余元素 - 但是Concat
很懒.现在,递归变得更加混乱:在大多数情况下,你的大多数元素IEnumerable
都是渴望的 - 你创建了左右列表,这些列表也是由大多数渴望+懒惰的尾巴构成的.你最终得到一个排序的List<int>
,懒惰地连接到一个懒惰的指针,它应该只是最后一个元素(其他元素之前被合并).
这是你的函数的调用图 - 红色表示一个懒惰的集合,黑色表示一个实数:
当您更改列表时,新列表基本上是完整的,但最后一个元素是惰性的,并指向原始列表中最大元素的位置.
结果大部分都很好,但它的最后一个元素仍然指向原始列表:
最后一个例子:考虑您正在更改原始列表中的所有元素.如您所见,已排序集合中的大多数元素保持不变,但最后一个是惰性并指向新值:
var ints = new List<int> { 3,2,1 };
var mergeSortInt = new MergeSort<int>();
var sortedInts = mergeSortInt.Sort(ints);
// sortedInts is { 1, 2, 3 }
for(int i=0;i<ints.Count;i++) ints[i] = -i * 10;
// sortedInts is { 1, 2, 0 }
Run Code Online (Sandbox Code Playgroud)
以下是Ideone上的相同示例:http://ideone.com/FQVR7
无法重现 - 我刚试过这个,它的工作非常好.显然,它以各种方式效率相当低,但删除ToList
调用并没有使它失败.
这是我的测试代码,MergeSort
代码按原样,但没有ToList()
调用:
using System;
using System.Collections.Generic;
public static class Extensions
{
public static void Dump<T>(this IEnumerable<T> items, string name)
{
Console.WriteLine(name);
foreach (T item in items)
{
Console.Write(item);
Console.Write(" ");
}
Console.WriteLine();
}
}
class Test
{
static void Main()
{
var ints = new List<int> { 5, 8, 2, 1, 7 };
var mergeSortInt = new MergeSort<int>();
var sortedInts = mergeSortInt.Sort(ints);
sortedInts.Dump("Sorted");
}
}
Run Code Online (Sandbox Code Playgroud)
输出:
Sorted
1 2 5 7 8
Run Code Online (Sandbox Code Playgroud)
也许问题是你如何测试你的代码?
归档时间: |
|
查看次数: |
1303 次 |
最近记录: |