如何根据对象的属性对对象列表进行排序？

Question

如何根据对象的属性对对象列表进行排序？

Nic*_*ant 724 python sorting oop list count

我有一个Python对象列表,我想根据对象本身的属性进行排序.该列表如下:

>>> ut
[<Tag: 128>, <Tag: 2008>, <Tag: <>, <Tag: actionscript>, <Tag: addresses>,
 <Tag: aes>, <Tag: ajax> ...]

Run Code Online (Sandbox Code Playgroud)

每个对象都有一个计数:

>>> ut[1].count
1L

Run Code Online (Sandbox Code Playgroud)

我需要按递减计数的数量对列表进行排序.

我已经看过几种方法,但我正在寻找Python的最佳实践.

Answer 1

Tri*_*ych 1196

# To sort the list in place...
ut.sort(key=lambda x: x.count, reverse=True)

# To return a new list, use the sorted() built-in function...
newlist = sorted(ut, key=lambda x: x.count, reverse=True)

Run Code Online (Sandbox Code Playgroud)

更多按键排序»

在大型列表中,使用operator.attrgetter('count')作为密钥可以获得更好的性能.这只是本答案中lambda函数的优化(低级)形式. (41认同)
感谢您的出色回答。如果它是字典列表并且'count'是它的键之一，则需要像下面这样更改：ut.sort（key = lambda x：x ['count']，reverse = True） (3认同)
没问题。顺便说一句，如果 muhuk 是正确的并且它是 Django 对象的列表，那么您应该考虑他的解决方案。但是，对于排序对象的一般情况，我的解决方案可能是最佳实践。 (2认同)
我认为它值得进行以下更新：如果需要按多个字段排序，可以通过连续调用 sort() 来实现，因为 python 使用稳定的排序算法。 (2认同)
谢谢@KenanBanks，你是对的。令人烦恼的是，Outlook 对日历时区做了一些奇怪的事情，因此有些内容没有时区详细信息......不知道为什么！ (2认同)

Answer 2

tzo*_*zot 80

可以使用最快的方法,特别是如果您的列表包含大量记录operator.attrgetter("count").但是,这可能会在运行前版本的Python上运行,因此拥有一个回退机制会很不错.您可能想要执行以下操作,然后:

try: import operator
except ImportError: keyfun= lambda x: x.count # use a lambda if no operator module
else: keyfun= operator.attrgetter("count") # use operator since it's faster than lambda

ut.sort(key=keyfun, reverse=True) # sort in-place

Run Code Online (Sandbox Code Playgroud)

在这里,我将使用变量名称"keyfun"而不是"cmpfun"来避免混淆.sort()方法也通过cmp =参数接受比较函数. (7认同)

Answer 3

Jos*_*dal 59

读者应该注意到key =方法:

ut.sort(key=lambda x: x.count, reverse=True)

Run Code Online (Sandbox Code Playgroud)

比向对象添加丰富的比较运算符要快许多倍.我很惊讶地读到了这篇文章("果壳里的Python"第485页).您可以通过在这个小程序上运行测试来确认这一点:

#!/usr/bin/env python
import random

class C:
    def __init__(self,count):
        self.count = count

    def __cmp__(self,other):
        return cmp(self.count,other.count)

longList = [C(random.random()) for i in xrange(1000000)] #about 6.1 secs
longList2 = longList[:]

longList.sort() #about 52 - 6.1 = 46 secs
longList2.sort(key = lambda c: c.count) #about 9 - 6.1 = 3 secs

Run Code Online (Sandbox Code Playgroud)

我的非常小的测试表明,第一种测试速度慢了10倍,但该书说它一般只慢了约5倍.他们说的原因是由于python(timsort)中使用的高度优化的排序算法.

但是,非常奇怪的是.sort(lambda)比普通的旧.sort()更快.我希望他们解决这个问题.

__cmp__ 在 Python 3 中已弃用：https://docs.python.org/3/howto/sorting.html#the-old-way-using-the-cmp-parameter (4认同)
定义`__cmp__`相当于调用`.sort(cmp=lambda)`，而不是`.sort(key=lambda)`，所以它一点也不奇怪。 (2认同)

Answer 4

小智 36

from operator import attrgetter
ut.sort(key = attrgetter('count'), reverse = True)

Run Code Online (Sandbox Code Playgroud)

Answer 5

jpp*_*jpp 36

面向对象的方法

最好的做法是使对象排序逻辑(如果适用)成为类的属性,而不是在每个实例中包含所需的顺序.

这可确保一致性并消除对样板代码的需求.

至少,您应该为此指定__eq__和__lt__操作.然后就用吧sorted(list_of_objects).

class Card(object):

    def __init__(self, rank, suit):
        self.rank = rank
        self.suit = suit

    def __eq__(self, other):
        return self.rank == other.rank and self.suit == other.suit

    def __lt__(self, other):
        return self.rank < other.rank

hand = [Card(10, 'H'), Card(2, 'h'), Card(12, 'h'), Card(13, 'h'), Card(14, 'h')]
hand_order = [c.rank for c in hand]  # [10, 2, 12, 13, 14]

hand_sorted = sorted(hand)
hand_sorted_order = [c.rank for c in hand_sorted]  # [2, 10, 12, 13, 14]

Run Code Online (Sandbox Code Playgroud)

@FriendFX，我相信[this](https://docs.python.org/3/howto/sorting.html#odd-and-ends)暗示了这一点：`•排序例程保证在以下情况下使用 __lt__()比较两个对象...` (4认同)
这就是我一直在寻找的！您能否向我们指出一些详细说明为什么“__eq__”和“__lt__”是最低实现要求的文档？ (3认同)
@FriendFX：请参阅 https://portingguide.readthedocs.io/en/latest/comparisons.html 进行比较和排序 (2认同)

Answer 6

muh*_*huk 15

它看起来很像Django ORM模型实例的列表.

为什么不像这样对查询进行排序:

ut = Tag.objects.order_by('-count')

Run Code Online (Sandbox Code Playgroud)

Answer 7

rob*_*rob 10

将丰富的比较运算符添加到对象类,然后使用列表的sort()方法.在python中
查看丰富的比较.

更新:虽然这种方法可行,但我认为Triptych的解决方案更适合您的情况,因为方式更简单.

Answer 8

Geo*_*rgy 7

如果要排序的属性是property，则可以避免导入operator.attrgetter并使用该属性的fget方法。

例如，对于Circle具有属性的类，radius我们可以circles按半径对列表进行排序，如下所示：

result = sorted(circles, key=Circle.radius.fget)

Run Code Online (Sandbox Code Playgroud)

这不是最著名的功能，但经常为我节省导入的一行。

归档时间：	17 年，1 月前
查看次数：	476127 次
最近记录：	6 年，2 月前