Arrays.sort和Arrays.parallelSort函数行为

Rak*_*han 5 java java-8

我有以下代码,

import java.util.Arrays;


public class ParellelStream {

    public static void main(String args[]){
        Double dbl[] = new Double[1000000];
        for(int i=0; i<dbl.length;i++){
            dbl[i]=Math.random();
        }

        long start = System.currentTimeMillis();
        Arrays.parallelSort(dbl);
        System.out.println("time taken :"+((System.currentTimeMillis())-start));

    }

}
Run Code Online (Sandbox Code Playgroud)

当我运行此代码时需要大约700到800毫秒的时间,但是当我将行Arrays.parallelSort替换为Arrays.sort时,它需要500到600毫秒.我读到了Arrays.parallelSort和Arrays.sort方法,该方法说Arrays.parellelSort在数据集较小时性能较差但在这里我使用的是1000000个元素的数组.什么可能是parallelSort性能不佳的原因?? 我正在使用java8.

bhs*_*cer 5

parallelSort函数将为您机器上的每个cpu核心使用一个线程.特别是parallelSort在ForkJoin公共线程池上运行任务.如果您只有一个核心,那么您将看不到单线程排序的改进.

如果您只有多个核心,那么您将需要一些与创建新线程相关的前期成本,这意味着对于相对较小的阵列,您不会看到线性性能提升.

用于比较双精度的比较功能不是一项昂贵的功能.我认为在这种情况下,可以安全地认为1000000个元素很小,并且创建这些线程的前期成本超过了使用多个线程的好处.由于前期成本将得到修复,您应该会看到更大阵列的性能提升.

  • 同样对于基准测试,我建议使用System.nanoTime()而不是System.currentTimeMillis(),因为currentTimeMillis在大多数机器上没有毫秒精度. (2认同)

Jea*_*ard 4

我读到了有关 Arrays.parallelSort 和 Arrays.sort 方法的内容,其中指出当数据集很小时,Arrays.parellelSort 的性能很差,但在这里我使用的是 1000000 个元素的数组。

这不是唯一需要考虑的事情。这在很大程度上取决于您的机器(CPU 如何处理多线程等)。

这里引用了 Java 教程的并行性部分

请注意,并行性不会自动比串行执行操作更快,尽管如果您有足够的数据和处理器核心,则可能会更快[...],但您仍然有责任确定您的应用程序是否适合并行性。

您可能还想查看代码java.util.ArraysParallelSortHelpers以更好地理解该算法。

请注意,该parallelSort方法使用 Java 7 中引入的方法ForkJoinPool来利用计算机的每个处理器,如 javadoc 中所述:

ForkJoinPool 是根据给定的目标并行度级别构建的;默认情况下,等于可用处理器的数量。

请注意,如果数组的长度小于1 << 13,则将使用适当的方法对数组进行排序Arrays.sort

也可以看看