我试图通过.par以非常基本的方式使用并行集合 - 我希望集合不按顺序执行,但事实并非如此:
scala> (1 to 10) map println
1
2
3
4
5
6
7
8
9
10
Run Code Online (Sandbox Code Playgroud)
和
scala> (1 to 10).par map println
1
2
3
4
5
6
7
8
9
10
Run Code Online (Sandbox Code Playgroud)
在后一种情况下,顺序似乎不应该是顺序的.这是scala 2.9,我的机器有2个核心.这可能是某处的错误配置?谢谢!
编辑:我确实尝试使用大集(100k)运行,结果仍然是顺序的.
huy*_*hjl 11
因人而异:
scala> (1 to 10).par map println
1
6
2
3
4
7
5
8
9
Run Code Online (Sandbox Code Playgroud)
这也是双核......
我想如果你尝试足够的跑步,你可能会看到不同的结果.这是一段代码,展示了一些发生的事情:
import collection.parallel._
import collection.parallel.immutable._
class ParRangeEx(range: Range) extends ParRange(range) {
// Some minimal number of elements after which this collection
// should be handled sequentially by different processors.
override def threshold(sz: Int, p:Int) = {
val res = super.threshold(sz, p)
printf("threshold(%d, %d) returned %d\n", sz, p, res)
res
}
override def splitter = {
new ParRangeIterator(range)
with SignalContextPassingIterator[ParRangeIterator] {
override def split: Seq[ParRangeIterator] = {
val res = super.split
println("split " + res) // probably doesn't show further splits
res
}
}
}
}
new ParRangeEx((1 to 10)).par map println
Run Code Online (Sandbox Code Playgroud)
一些运行我得到散布处理,一些运行我得到顺序处理.它似乎将负载分成两部分.如果将返回的阈值数更改为11,您将看到工作负载永远不会被拆分.
底层调度机制基于fork-join和work stealing.有关一些见解,请参阅以下JSR166源代码.这可能是驱动相同线程是否会接收两个任务(因此看起来是顺序的)或两个线程在每个任务上工作的原因.
这是我的计算机上的示例输出:
threshold(10, 2) returned 1
split List(ParRangeIterator(over: Range(1, 2, 3, 4, 5)),
ParRangeIterator(over: Range(6, 7, 8, 9, 10)))
threshold(10, 2) returned 1
threshold(10, 2) returned 1
threshold(10, 2) returned 1
threshold(10, 2) returned 1
threshold(10, 2) returned 1
6
7
threshold(10, 2) returned 1
8
1
9
2
10
3
4
5
Run Code Online (Sandbox Code Playgroud)