如何排序(列表/元组)列表/元组?

Sta*_*tan 585 python sorting tuples list

我在列表列表或元组列表中有一些数据,如下所示:

data = [[1,2,3], [4,5,6], [7,8,9]]
data = [(1,2,3), (4,5,6), (7,8,9)]
Run Code Online (Sandbox Code Playgroud)

我想按子集中的第二个元素排序.意思是,按2,5,8排序,其中2来自(1,2,3),5来自(4,5,6).这样做的常用方法是什么?我应该在列表中存储元组或列表吗?

Ste*_*hen 1003

sorted_by_second = sorted(data, key=lambda tup: tup[1])
Run Code Online (Sandbox Code Playgroud)

要么:

data.sort(key=lambda tup: tup[1])  # sorts in place
Run Code Online (Sandbox Code Playgroud)

  • @billwild:帮助(排序).反向=真. (63认同)
  • 使用itemgetter的@Stephen更快更简单:`key = itemgetter(1)`并且在文件的开头:`from operator import itemgetter` (28认同)
  • 知道如何将它更大到更小吗? (10认同)
  • @Cemre 对于第二个例子,这里的 `sort` 是 Python 的 `List` 对象的一个​​方法,它接收一个 lambda 函数作为它的 `key` 参数。您可以将其命名为“tup”或“t”,或者您喜欢的任何名称,它仍然可以工作。`tup` 在这里指定了列表元组的索引,所以 `1` 意味着排序将由原始列表(`2, 5, 8`)中元组的第二个值执行。 (3认同)
  • 我对“使用 itemgetter 更快更简单”这种未经证实的说法持怀疑态度。虽然我主观上认为直观的 `lambda` 方法比不直观的 `itemgetter` 类更简单,但 `itemgetter` _确实_确实[看起来更快](/sf/answers/1207060851/)。我很好奇这是为什么。我粗略的怀疑是,`lambda` 会产生将所有局部变量捕获到闭包上下文中的隐藏成本,而 `itemgetter` 实例则不会。_**tl;dr:** 总是使用`itemgetter`,因为速度胜出。_ (3认同)

man*_*ova 204

from operator import itemgetter
data.sort(key=itemgetter(1))
Run Code Online (Sandbox Code Playgroud)

  • _这应该是公认的答案._另见[查理](/sf/users/10218351/)的[发布时间](/sf/answers/1207060851/),演示`itemgetter`类,比同等的`lambda`函数平均快****126%. (27认同)
  • 您还可以按层次排序多个索引,例如`data.sort(key = itemgetter(3,1))` (5认同)

小智 50

我只想添加到Stephen的答案,如果你想将数组从高到低排序,除了上面的评论之外的另一种方法只是将其添加到该行:

reverse = True
Run Code Online (Sandbox Code Playgroud)

结果如下:

data.sort(key=lambda tup: tup[1], reverse=True)
Run Code Online (Sandbox Code Playgroud)


elm*_*elm 35

对于按多个标准排序,即例如通过元组中的第二个和第三个元素,让

data = [(1,2,3),(1,2,1),(1,1,4)]
Run Code Online (Sandbox Code Playgroud)

因此,定义一个lambda,它返回一个描述优先级的元组

sorted(data, key=lambda tup: (tup[1],tup[2]) )
[(1, 1, 4), (1, 2, 1), (1, 2, 3)]
Run Code Online (Sandbox Code Playgroud)


tca*_*uce 27

斯蒂芬的答案是我使用的答案.为了完整起见,这里与列表内涵的DSU(装饰排序-去除装饰)模式:

decorated = [(tup[1], tup) for tup in data]
decorated.sort()
undecorated = [tup for second, tup in decorated]
Run Code Online (Sandbox Code Playgroud)

或者,更简洁:

[b for a,b in sorted((tup[1], tup) for tup in data)]
Run Code Online (Sandbox Code Playgroud)

正如Python Sorting HowTo中所提到的,自从Python 2.4开始实现关键功能时,这是不必要的.

  • 所以这个答案对Python 2.3有用吗?在更新的Python版本中是否有任何有效的用途,您可以稍微详细说明一下?如果没有,没有麻烦...只是路过,看到这个,老noggin只是一点点搅拌.无论如何,欢呼和感谢这一步回到Python的早期阶段. (2认同)

l m*_*zhi 16

为了排序元组的列表(<word>, <count>),用于count按降序排列,并word按照字母顺序:

data = [
('betty', 1),
('bought', 1),
('a', 1),
('bit', 1),
('of', 1),
('butter', 2),
('but', 1),
('the', 1),
('was', 1),
('bitter', 1)]
Run Code Online (Sandbox Code Playgroud)

我用这个方法:

sorted(data, key=lambda tup:(-tup[1], tup[0]))
Run Code Online (Sandbox Code Playgroud)

它给了我结果:

[('butter', 2),
('a', 1),
('betty', 1),
('bit', 1),
('bitter', 1),
('bought', 1),
('but', 1),
('of', 1),
('the', 1),
('was', 1)]
Run Code Online (Sandbox Code Playgroud)


Mes*_*sco 11

没有lambda:

def sec_elem(s):
    return s[1]

sorted(data, key=sec_elem)
Run Code Online (Sandbox Code Playgroud)
def sec_elem(s):
    return s[1]

sorted(data, key=sec_elem)
Run Code Online (Sandbox Code Playgroud)


Wal*_*ter 6

itemgetter()比快一些lambda tup: tup[1],但增长幅度相对较小(大约10%到25%)。

(IPython会话)

>>> from operator import itemgetter
>>> from numpy.random import randint
>>> values = randint(0, 9, 30000).reshape((10000,3))
>>> tpls = [tuple(values[i,:]) for i in range(len(values))]

>>> tpls[:5]    # display sample from list
[(1, 0, 0), 
 (8, 5, 5), 
 (5, 4, 0), 
 (5, 7, 7), 
 (4, 2, 1)]

>>> sorted(tpls[:5], key=itemgetter(1))    # example sort
[(1, 0, 0), 
 (4, 2, 1), 
 (5, 4, 0), 
 (8, 5, 5), 
 (5, 7, 7)]

>>> %timeit sorted(tpls, key=itemgetter(1))
100 loops, best of 3: 4.89 ms per loop

>>> %timeit sorted(tpls, key=lambda tup: tup[1])
100 loops, best of 3: 6.39 ms per loop

>>> %timeit sorted(tpls, key=(itemgetter(1,0)))
100 loops, best of 3: 16.1 ms per loop

>>> %timeit sorted(tpls, key=lambda tup: (tup[1], tup[0]))
100 loops, best of 3: 17.1 ms per loop
Run Code Online (Sandbox Code Playgroud)


Ris*_*shi 6

@Stephen的回答是关键!这是一个更好的可视化的例子,

为Ready Player One粉丝大喊大叫!=)

>>> gunters = [('2044-04-05', 'parzival'), ('2044-04-07', 'aech'), ('2044-04-06', 'art3mis')]
>>> gunters.sort(key=lambda tup: tup[0])
>>> print gunters
[('2044-04-05', 'parzival'), ('2044-04-06', 'art3mis'), ('2044-04-07', 'aech')]
Run Code Online (Sandbox Code Playgroud)

key是一个函数,将被调用以转换集合的项目以进行比较..就像compareToJava中的方法一样.

传递给key的参数必须是可调用的.在这里,使用lambda创建一个匿名函数(可调用).
lambda的语法是单词lambda,后跟可迭代的名称,然后是单个代码块.

下面的例子中,我们正在排序一个元组列表,它包含某个事件和演员名称的信息时间.

我们按事件发生的时间对此列表进行排序 - 这是元组的第0个元素.

注意 - s.sort([cmp[, key[, reverse]]]) 对s项进行排序