sas*_*nin 37

争论sortsorted

双方sortsorted有三个关键字参数:cmp,keyreverse.

L.sort(cmp=None, key=None, reverse=False) -- stable sort *IN PLACE*;
cmp(x, y) -> -1, 0, 1

sorted(iterable, cmp=None, key=None, reverse=False) --> new sorted list
Run Code Online (Sandbox Code Playgroud)

使用keyreverse是首选,因为它们的工作速度比同等速度快得多cmp.

key应该是一个函数,它接受一个项目并返回一个值来进行比较和排序.reverse允许反转排序顺序.

使用key参数

您可以使用operator.itemgetter作为键参数来对元组中的第二个,第三个等项进行排序.

>>> from operator import itemgetter

>>> a = range(5)
>>> b = a[::-1]
>>> c = map(lambda x: chr(((x+3)%5)+97), a)
>>> sequence = zip(a,b,c)

# sort by first item in a tuple
>>> sorted(sequence, key = itemgetter(0))
[(0, 4, 'd'), (1, 3, 'e'), (2, 2, 'a'), (3, 1, 'b'), (4, 0, 'c')]

# sort by second item in a tuple
>>> sorted(sequence, key = itemgetter(1))
[(4, 0, 'c'), (3, 1, 'b'), (2, 2, 'a'), (1, 3, 'e'), (0, 4, 'd')]

# sort by third item in a tuple
>>> sorted(sequence, key = itemgetter(2))
[(2, 2, 'a'), (3, 1, 'b'), (4, 0, 'c'), (0, 4, 'd'), (1, 3, 'e')]
Run Code Online (Sandbox Code Playgroud)

说明

序列可以包含任何对象,甚至不具有可比性,但如果我们可以定义一个函数来生成我们可以比较每个项的东西,我们可以在key参数中将此函数传递给sortsorted.

itemgetter特别是,创建了一个从其操作数中获取给定项的函数.其文档中的一个示例:

之后,f=itemgetter(2)呼叫f(r)返回r[2].

迷你基准,keyvscmp

出于好奇keycmp性能的比较,越小越好:

>>> from timeit import Timer
>>> Timer(stmt="sorted(xs,key=itemgetter(1))",setup="from operator import itemgetter;xs=range(100);xs=zip(xs,xs);").timeit(300000)
6.7079150676727295
>>> Timer(stmt="sorted(xs,key=lambda x:x[1])",setup="xs=range(100);xs=zip(xs,xs);").timeit(300000)
11.609490871429443
>>> Timer(stmt="sorted(xs,cmp=lambda a,b: cmp(a[1],b[1]))",setup="xs=range(100);xs=zip(xs,xs);").timeit(300000)
22.335839986801147
Run Code Online (Sandbox Code Playgroud)

因此,排序key似乎至少是排序的两倍cmp.使用itemgetter而不是lambda x: x[1]使排序更快.