4es*_*n0k 7 sorting mergesort timsort
来自:
http://svn.python.org/projects/python/trunk/Objects/listsort.txt
和:
http://en.wikipedia.org/wiki/Timsort
我知道,Timsort在进行优化时会有一些优化a0 > a1 > a2 > ...,但下一个数组呢:
10000,10000,9999,9999,9998,9998,....,9,9,8,8,7,7,6,6,5,5,4,4,3,3,2,2,1,1,0,0
这种阵列的时间效率是多少?
(整数被用来简化一个例子,需要稳定的排序)我做了一些测量,看起来,这样的数组对于Timsort来说不是"好"的情况.
实际上,JDK中的TimSort http://cr.openjdk.java.net/~martin/webrevs/openjdk7/timsort/raw_files/new/src/share/classes/java/util/TimSort.java 有一个方法"countRunAndMakeAscending"
@SuppressWarnings("unchecked")
private static int countRunAndMakeAscending(Object[] a, int lo, int hi) {
assert lo < hi;
int runHi = lo + 1;
if (runHi == hi)
return 1;
// Find end of run, and reverse range if descending
if (((Comparable) a[runHi++]).compareTo(a[lo]) < 0) { // Descending
while(runHi < hi && ((Comparable) a[runHi]).compareTo(a[runHi - 1]) < 0)
runHi++;
reverseRange(a, lo, runHi);
} else { // Ascending
while (runHi < hi && ((Comparable) a[runHi]).compareTo(a[runHi - 1]) >= 0)
runHi++;
}
return runHi - lo;
}
Run Code Online (Sandbox Code Playgroud)
为什么不以另一种方式实现它:
private static int countRunAndMakeAscending(Object[] a, int lo, int hi) {
int runHi = lo;
int lastEqual = lo;
int ascending = 0;
while (++runHi < hi) {
int c = ((Comparable) a[runHi+1]).compareTo(a[runHi]);
if (ascending == 0) {
if (c != 0) {
if (c > 0) {
ascending = 1;
} else {
ascending = -1;
reverseRange(a, lastEqual, runHi);
lastEqual = runHi;
}
}
} else if (ascending == 1) {
if (c < 0) {
return runHi - lo;
}
} else {
if (c > 0) {
reverseRange(a, lastEqual, runHi);
reverseRange(a, lo, runHi);
return runHi - lo;
} else if (c < 0) {
reverseRange(a, lastEqual, runHi);
lastEqual = runHi;
}
}
}
if (ascending == -1) {
reverseRange(a, lastEqual, runHi);
reverseRange(a, lo, runHi);
}
return runHi - lo;
}
Run Code Online (Sandbox Code Playgroud)
所以它可以在非升序下工作吗?
是的。
基本上它决定“升序”实际上意味着“不降序”,而不失任何一般性 - 如果你有例如 [5,5,4 3] 它只会将其分解为 [5,5] (升序),然后[4,3](降序)在下一次调用时。
至于为什么,我想这是为了简单起见:只需尝试计算您的代码和原始代码中的调用次数 reverseRange(),您就会明白(我是通过注意到与另一个版本相比,我花了多长时间来理解一个版本)其他 :)
编辑:错错错错!正如 Oscar Smith 指出的那样,原因是为了让 timsort 成为一种稳定的排序算法。如果有人知道如何转移不应得的赏金......