Eri*_* J. 20
重要的变化
正如评论中指出的那样,在.Except()
内部使用一个集合,因此list1
在最终结果中将缺少任何重复的成员.
产生两个序列的集合差异
http://msdn.microsoft.com/en-us/library/system.linq.enumerable.except(v=vs.110).aspx
但是,有一个解决方案既是O(N)又保留了原始列表中的重复项:修改RemoveAll(i => list2.Contains(i))
方法以使用a HashSet<int>
来保存排除集.
List<int> list1 = Enumerable.Range(1, 10000000).ToList();
HashSet<int> exclusionSet = Enumerable.Range(500000, 10).ToHashSet();
list1.Remove(i => exclusionSet.Contains(i));
Run Code Online (Sandbox Code Playgroud)
MoreLinq中ToHashSet()
提供了扩展方法.
原始答案
你可以使用Linq
list1 = list1.Except(list2).ToList();
Run Code Online (Sandbox Code Playgroud)
UPDATE
出于好奇,我对@ HighCore的解决方案进行了简单的基准测试.
因为list2
只有一个元素,他的代码更快.随着list2
越来越大,他的代码变得极其缓慢.它看起来像是O(N平方)(或者更具体地是O(list1.length*list2.length),因为每个项目list1
与每个项目进行比较list2
).没有足够的数据点来检查我的解决方案的Big-O,但是当list2
有多个元素时,它会快得多.
用于测试的代码:
List<int> list1 = Enumerable.Range(1, 10000000).ToList();
List<int> list2 = Enumerable.Range(500000, 10).ToList(); // Gets MUCH slower as 10 increases to 100 or 1000
Stopwatch sw = Stopwatch.StartNew();
//list1 = list1.Except(list2).ToList();
list1.RemoveAll(i => list2.Contains(i));
sw.Stop();
var ms1 = sw.ElapsedMilliseconds;
Run Code Online (Sandbox Code Playgroud)
更新2
此解决方案为变量分配新列表list1
.正如@Толя指出的那样,原始的其他引用(如果有的话)list1
将不会更新.RemoveAll
除了最小尺寸之外,这个解决方案的性能都非常出色list2
.如果没有其他引用必须看到更新,那么最好是因为这个原因.
list1.RemoveAll(x => list2.Contains(x));
Run Code Online (Sandbox Code Playgroud)