pyspark:并行化和收集顺序保留

two*_*pad 7 apache-spark pyspark

对于 python 中的 Spark,sc.parallelize()collect()操作是否保持顺序?例如,如果我有一个元素列表x,将返回与?sc.parallelize(x).collect()完全相同的顺序的元素列表。x

小智 1

两者parallelizecollect保持秩序。Spark 中的大多数方法都没有。

  • 参考文档? (6认同)