scala:并行集合不起作用?

Hei*_*ing 7 scala

我试图通过.par以非常基本的方式使用并行集合 - 我希望集合不按顺序执行,但事实并非如此:

scala> (1 to 10) map println
1
2
3
4
5
6
7
8
9
10
Run Code Online (Sandbox Code Playgroud)

scala> (1 to 10).par map println
1
2
3
4
5
6
7
8
9
10
Run Code Online (Sandbox Code Playgroud)

在后一种情况下,顺序似乎不应该是顺序的.这是scala 2.9,我的机器有2个核心.这可能是某处的错误配置?谢谢!

编辑:我确实尝试使用大集(100k)运行,结果仍然是顺序的.

huy*_*hjl 11

因人而异:

scala> (1 to 10).par map println
1
6
2
3
4
7
5
8
9
Run Code Online (Sandbox Code Playgroud)

这也是双核......

我想如果你尝试足够的跑步,你可能会看到不同的结果.这是一段代码,展示了一些发生的事情:

import collection.parallel._
import collection.parallel.immutable._

class ParRangeEx(range: Range) extends ParRange(range) {
  // Some minimal number of elements after which this collection 
  // should be handled sequentially by different processors.
  override def threshold(sz: Int, p:Int) = {
    val res = super.threshold(sz, p)
    printf("threshold(%d, %d) returned %d\n", sz, p, res)
    res
  }
  override def splitter = {
    new ParRangeIterator(range) 
        with SignalContextPassingIterator[ParRangeIterator] {
      override def split: Seq[ParRangeIterator] = {
        val res = super.split
        println("split " + res) // probably doesn't show further splits
        res
      }
    }
  }
}

new ParRangeEx((1 to 10)).par map println
Run Code Online (Sandbox Code Playgroud)

一些运行我得到散布处理,一些运行我得到顺序处理.它似乎将负载分成两部分.如果将返回的阈值数更改为11,您将看到工作负载永远不会被拆分.

底层调度机制基于fork-join和work stealing.有关一些见解,请参阅以下JSR166源代码.这可能是驱动相同线程是否会接收两个任务(因此看起来是顺序的)或两个线程在每个任务上工作的原因.

这是我的计算机上的示例输出:

threshold(10, 2) returned 1
split List(ParRangeIterator(over: Range(1, 2, 3, 4, 5)), 
  ParRangeIterator(over: Range(6, 7, 8, 9, 10)))
threshold(10, 2) returned 1
threshold(10, 2) returned 1
threshold(10, 2) returned 1
threshold(10, 2) returned 1
threshold(10, 2) returned 1
6
7
threshold(10, 2) returned 1
8
1
9
2
10
3
4
5
Run Code Online (Sandbox Code Playgroud)