阅读http://spark.apache.org/docs/latest/programming-guide.html上的 Apache Spark指南,它指出:
为什么取功能不能并行运行?并行实现这种功能有什么困难?是否与事实有关,为了获取RDD的前n个元素,需要遍历整个RDD?
parallel-processing scala apache-spark
apache-spark ×1
parallel-processing ×1
scala ×1