小编Dav*_*ics的帖子

我在哪里可以找到 Spark 中的操作成本?

假设我有两个大小为 M1 和 M2 的 RDD,它们平均分布在 p 个分区中。

我很想知道(理论上/大约)操作过滤器、映射、leftOuterJoin、++、reduceByKey 等的成本是多少。

谢谢您的帮助。

performance processing-efficiency memory-efficient apache-spark rdd

5
推荐指数
1
解决办法
1629
查看次数