添加到集合然后对其进行排序或添加到已排序的集合是否更快？

Question

添加到集合然后对其进行排序或添加到已排序的集合是否更快？

如果我有Map这样的:

HashMap<Integer, ComparableObject> map;

Run Code Online (Sandbox Code Playgroud)

我想获得一个使用自然排序排序的值集合,哪种方法最快？

(一个)

创建可排序集合的实例,例如ArrayList,添加值,然后对其进行排序:

List<ComparableObject> sortedCollection = new ArrayList<ComparableObject>(map.values());
Collections.sort(sortedCollection);

Run Code Online (Sandbox Code Playgroud)

(B)

创建一个有序集合的实例TreeSet,然后添加值:

Set<ComparableObject> sortedCollection = new TreeSet<ComparableObject>(map.values());

Run Code Online (Sandbox Code Playgroud)

请注意,结果集合永远不会被修改,因此排序只需要进行一次.

Answer 1

fas*_*seg 80

TreeSet具有 log(n)时间复杂度的add()/remove()/contains()方法保证.排序ArrayList采取n*log(n)操作,但add()/get()只采取1操作.

因此,如果您主要检索并且不经常排序,那么这ArrayList是更好的选择.如果你经常排序,但不要检索那么多TreeSet将是一个更好的选择.

Answer 2

Bar*_*ter 16

从理论上讲,最后的排序应该更快.在整个过程中维护已排序状态可能需要额外的CPU时间.

从CS的角度来看,两个操作都是NlogN,但是1种应该具有较低的常量.

+1 理论与现实脱节的情况之一。:) 根据我的经验，最后的排序往往要快几个数量级...... (4认同)

Answer 3

Sea*_*oyd 9

为什么不使用两全其美？如果您再也不使用它,请使用TreeSet进行排序并使用内容初始化ArrayList

List<ComparableObject> sortedCollection = 
    new ArrayList<ComparableObject>( 
          new TreeSet<ComparableObject>(map.values()));

Run Code Online (Sandbox Code Playgroud)

编辑:

我已经创建了一个基准测试(您可以在pastebin.com/5pyPMJav上访问它)来测试三种方法(ArrayList + Collections.sort,TreeSet和我最好的两种方法)并且我总是获胜.测试文件创建一个包含10000个元素的映射,其中的值有一个故意糟糕的比较器,然后三个策略中的每一个都有机会a)对数据进行排序,b)迭代它.这是一些示例输出(您可以自己测试):

编辑:我添加了一个方面,记录调用Thingy.compareTo(Thingy),我还添加了一个基于PriorityQueues的新策略,比以前的任何一个解决方案都要快得多(至少在排序方面).

compareTo() calls:123490
Transformer ArrayListTransformer
    Creation: 255885873 ns (0.255885873 seconds) 
    Iteration: 2582591 ns (0.002582591 seconds) 
    Item count: 10000

compareTo() calls:121665
Transformer TreeSetTransformer
    Creation: 199893004 ns (0.199893004 seconds) 
    Iteration: 4848242 ns (0.004848242 seconds) 
    Item count: 10000

compareTo() calls:121665
Transformer BestOfBothWorldsTransformer
    Creation: 216952504 ns (0.216952504 seconds) 
    Iteration: 1604604 ns (0.001604604 seconds) 
    Item count: 10000

compareTo() calls:18819
Transformer PriorityQueueTransformer
    Creation: 35119198 ns (0.035119198 seconds) 
    Iteration: 2803639 ns (0.002803639 seconds) 
    Item count: 10000

Run Code Online (Sandbox Code Playgroud)

奇怪的是,我的方法在迭代中表现最好(我原本以为迭代中的ArrayList方法没有差异,我的基准测试中是否有错误？)

免责声明:我知道这可能是一个可怕的基准,但它有助于明确指出你,我当然没有操纵它来让我的方法获胜.

(代码对于equals/hashcode/compareTo构建器具有apache commons/lang的依赖关系,但它很容易重构出来)

这实际上不是两个世界中最糟糕的吗？我需要的只是一个自然顺序的集合,这是`new TreeSet <ComparableObject>(map.values())`返回的.将它包含在`ArrayList`中只会添加不必要的操作. (3认同)
我特别指出你在写基准时所付出的努力!不过我觉得它有一个缺陷.似乎JVM运行的`Transformer`实例比后面的更快地在列表中运行:首先放置`BestOfBothWorldsTransformer`,它突然运行得慢得多.所以我重写了你的基准,随机选择一个变压器并对结果取平均值.在我的测试中,`TreeSetTransformer`始终击败`BestOfBothWorldsTransformer`,它始终击败`ArrayListTransformer` - 而不是我的预期!但差别很小.请参见http://pastebin.com/L0t5QDV9 (2认同)

Answer 4

loc*_*cka 5

如果您选择实施B),请务必阅读我对底部TreeSet的评论

如果你的应用程序只是偶尔进行排序而是经常重复,我会说你最好使用一个简单的未排序列表.将其排序一次,然后从更快的迭代中获益.迭代在数组列表上特别快.

但是,如果您希望始终保证排序顺序,或者您可能经常添加/删除元素,则使用已排序的集合并在迭代时执行命中.

所以在你的情况下,我会说A)是更好的选择.该列表排序一次,不会更改,因此可以从阵列中获益.迭代应该非常快,特别是如果你知道它的ArrayList并且可以直接使用ArrayList.get()而不是Iterator.

我还要补充一点,根据定义,TreeSet是一个Set,它意味着对象是唯一的.TreeSet通过在Comparator/Comparable上使用compareTo来确定相等性.如果您尝试添加compareTo返回值为0的两个对象,您可能很容易发现自己缺少数据.例如,向TreeSet添加"C","A","B","A"将返回"A","B" ", "C"

归档时间：	15 年，3 月前
查看次数：	30562 次
最近记录：	7 年，10 月前