从列表中删除重复项和原始项

Question

从列表中删除重复项和原始项

给定一个字符串列表，我想删除重复项和原始单词。

例如：

lst = ['a', 'b', 'c', 'c', 'c', 'd', 'e', 'e']

Run Code Online (Sandbox Code Playgroud)

输出应该删除重复项，所以像这样 ['a', 'b', 'd']

我不需要保留订单。

Answer 1

Mar*_*ers 6

使用一个collections.Counter()object，然后只保留那些计数为 1 的值：

from collections import counter

[k for k, v in Counter(lst).items() if v == 1]

Run Code Online (Sandbox Code Playgroud)

这是一个 O(N) 算法；您只需要遍历 N 个项目的列表一次，然后在较少的项目 (< N) 上进行第二次循环以提取仅出现一次的那些值。

如果顺序很重要并且您使用的是 Python < 3.6，请将步骤分开：

counts = Counter(lst)
[k for k in lst if counts[k] == 1]

Run Code Online (Sandbox Code Playgroud)

演示：

>>> from collections import Counter
>>> lst = ['a', 'b', 'c', 'c', 'c', 'd', 'e', 'e']
>>> [k for k, v in Counter(lst).items() if v == 1]
['a', 'b', 'd']
>>> counts = Counter(lst)
>>> [k for k in lst if counts[k] == 1]
['a', 'b', 'd']

Run Code Online (Sandbox Code Playgroud)

两种方法的顺序相同纯属巧合；对于 Python 3.6 之前的 Python 版本，其他输入可能会导致不同的顺序。

在 Python 3.6 中，字典的实现发生了变化，现在保留了输入顺序。

归档时间：	11 年，2 月前
查看次数：	1609 次
最近记录：	5 年，4 月前