scala parallel collections of parallelism

Question

scala parallel collections of parallelism

在LINQ的scala并行集合中是否有任何等价物来withDegreeOfParallelism设置将运行查询的线程数？我想并行运行一个需要运行一定数量线程的操作.

Answer 1

使用最新的主干,使用JVM 1.6或更高版本,使用:

collection.parallel.ForkJoinTasks.defaultForkJoinPool.setParallelism(parlevel: Int)

Run Code Online (Sandbox Code Playgroud)

不过,这可能是未来发生变化的主题.计划在下一版本中采用更统一的方法来配置所有Scala任务并行API.

但请注意,虽然这将决定查询使用的处理器数量,但这可能不是运行查询所涉及的实际线程数.由于并行集合支持嵌套并行性,因此实际线程池实现可以分配更多线程来运行查询,如果它检测到这是必要的.

编辑:

从Scala 2.10开始,设置并行度级别的首选方法是将tasksupport字段设置为新TaskSupport对象,如下例所示:

scala> import scala.collection.parallel._
import scala.collection.parallel._

scala> val pc = mutable.ParArray(1, 2, 3)
pc: scala.collection.parallel.mutable.ParArray[Int] = ParArray(1, 2, 3)

scala> pc.tasksupport = new ForkJoinTaskSupport(new scala.concurrent.forkjoin.ForkJoinPool(2))
pc.tasksupport: scala.collection.parallel.TaskSupport = scala.collection.parallel.ForkJoinTaskSupport@4a5d484a

scala> pc map { _ + 1 }
res0: scala.collection.parallel.mutable.ParArray[Int] = ParArray(2, 3, 4)

Run Code Online (Sandbox Code Playgroud)

在ForkJoinTaskSupport使用fork连接池实例化对象时,必须将fork连接池的并行级别设置为所需的值(2在示例中).

Answer 2

Jul*_*gaz 5

与JVM版本无关,使用Scala 2.9+(引入并行集合),您还可以使用grouped(Int)和par函数的组合在小块上执行并行作业,如下所示:

scala> val c = 1 to 5
c: scala.collection.immutable.Range.Inclusive = Range(1, 2, 3, 4, 5)

scala> c.grouped(2).seq.flatMap(_.par.map(_ * 2)).toList
res11: List[Int] = List(2, 4, 6, 8, 10)

Run Code Online (Sandbox Code Playgroud)

grouped(2)创建长度为2或更小seq的块,确保块的集合不是并行的(在这个例子中没用),然后_ * 2在小的并行块(用其创建par)上执行该函数,从而确保最多并行执行2个线程.

然而,这可能比设置worker pool参数的效率稍差,我不确定.

归档时间：	14 年，10 月前
查看次数：	7909 次
最近记录：	8 年，2 月前