"group by"聚合函数与字典理解

Question

"group by"聚合函数与字典理解

我有一系列对(名称,分数),有重复的名字.我想获得每个名字的最高分.名称标签本身对于最终结果是可选的.这是一个有效的实施:

from collections import defaultdict
scores = (('eyal', 76), ('alex', 50), ('oded', 90), ('eyal', 100), ('alex', 99))
distinct = defaultdict(set)
for score in scores:
    distinct[score[0]].add(score[1])
max_scores = [max(distinct[k]) for k in distinct]
print (max_scores)

Run Code Online (Sandbox Code Playgroud)

我想知道,这可以使用字典理解一步完成吗？

Answer 1

NPE*_*NPE 5

In [22]: dict(sorted(scores))
Out[22]: {'alex': 99, 'eyal': 100, 'oded': 90}

Run Code Online (Sandbox Code Playgroud)

这是基于这样的观察:一旦我们对元组进行排序,我们只想保留每个名字的最后一个元组,并且dict()做得很好.

或者,

In [16]: [max(vals) for _,vals in itertools.groupby(sorted(scores), lambda x:x[0])]
Out[16]: [('alex', 99), ('eyal', 100), ('oded', 90)]

Run Code Online (Sandbox Code Playgroud)

这更详细,但也更一般.例如,它可以很容易地适应计算平均分数,而第一个解决方案则不能.

`dict(sorted(scores))`应该在一行中完成.[该死的我很快;)] (2认同)
`字典(排序(分数))`.[哇,4秒太慢!] (2认同)

归档时间：	13 年，2 月前
查看次数：	2134 次
最近记录：	13 年，2 月前