C#如何让SelectMany返回收益?

sap*_*ket 6 c# linq combinatorics

假设我有以下通用组合生成器静态方法:

public static IEnumerable<IEnumerable<T>> GetAllPossibleCombos<T>(
    IEnumerable<IEnumerable<T>> items)
{
    IEnumerable<IEnumerable<T>> combos = new[] {new T[0]};

    foreach (var inner in items)
        combos = combos.SelectMany(c => inner, (c, i) => c.Append(i));

     return combos;
}
Run Code Online (Sandbox Code Playgroud)

也许我没有正确理解这一点,但是这不是在RAM中建立整个组合列表吗?如果存在大量项目,则该方法可能导致计算机的RAM用尽。

有没有一种方法可以重写方法以yield return在每个组合上使用a ,而不是返回整个组合组?

Eri*_*ert 8

您的问题中存在一些误解,这是令人敬畏的,因为现在您有机会学习事实而不是神话。


首先,您要实现的方法通常称为CartesianProduct,而不是GetAllPossibleCombos,因此请考虑重命名。


也许我没有正确理解

您对它的理解不正确。

这不是在RAM中建立整个组合列表吗?

。查询构建器将生成查询,而不是执行查询的结果。 当您执行操作时SelectMany,所得到的是将来将进行选择的对象。您没有得到该选择的结果。

如果存在大量项目,则该方法可能导致计算机的RAM用尽。

今天将是停止将内存和RAM视为同一事物的好日子。当进程的内存不足时,它不会耗尽RAM。它用完了不是RAM 的地址空间。考虑内存的更好方法是:内存是磁盘上的页面文件,而RAM是使您的页面文件更快的特殊硬件。当RAM耗尽时,您的计算机可能会变得异常缓慢,但是直到地址空间用尽时,您才不会耗尽内存。记住,进程内存是虚拟的

现在,在某些情况下,执行此代码效率不高,因为枚举查询用尽了堆栈。在某些情况下,由于将n个项目向上移动了n个深度,因此执行效率低下。我建议您对代码进行更深入的分析,看看是否是这种情况,然后报告。


有没有一种方法可以重写该方法以在每个组合上使用yield return,而不是返回整个组合集?

SelectMany实现为yield return在一个foreach循环,所以你已经实现了它的yield return每个组合; 您刚刚隐藏了对yield return的调用SelectMany

也就是说,SelectMany<A, B, C>(IE<A> items, Func<A, IE<B>> f, Func<A, B, C> g)实现为类似以下内容:

foreach(A a in items)
  foreach(B b in f(a))
    yield return g(a, b);
Run Code Online (Sandbox Code Playgroud)

因此,您已经在中完成了yield return

如果您想编写一个直接执行a 的方法,那会yield return有点困难;最简单的方法是在每个子序列上形成一个枚举器数组,然后从每个Current枚举yield return器生成一个向量,然后再将正确的迭代器向前推进一个步骤。继续这样做,直到不再有正确的迭代器前进为止。

正如您可能从该描述中看到的那样,簿记变得混乱。这是可行的,但编写的代码不是很好。试试看吧!该解决方案的好处是,由于您不消耗任何堆栈,因此可以保证具有良好的性能。

更新:这个相关的问题有一个答案,它做了一个迭代算法,但是我没有查看它是否正确。/sf/answers/4037863861/


最后,我鼓励您将自己的实现与我的实现进行比较:

https://ericlippert.com/2010/06/28/computing-a-cartesian-product-with-linq/

我的实现方式与您的实现方式有根本不同吗,还是我们只是使用稍有不同的语法做同样的事情?想一想。

另外,我鼓励您阅读伊恩·格里菲斯(Ian Griffiths)的精彩文章(共6部分),该系列分析了此功能的各种实现:

http://www.interact-sw.co.uk/iangblog/2010/07/28/linq-cartesian-1