小编lee*_*lee的帖子

如何计算Spark RDD的平均值?

我在Spark Scala中遇到问题,我想从Rdd数据中计算平均值,我创建了这样的新RDD,

[(2,110),(2,130),(2,120),(3,200),(3,206),(3,206),(4,150),(4,160),(4,170)]
Run Code Online (Sandbox Code Playgroud)

我想这样数

[(2,(110+130+120)/3),(3,(200+206+206)/3),(4,(150+160+170)/3)]
Run Code Online (Sandbox Code Playgroud)

然后,得到这样的结果,

   [(2,120),(3,204),(4,160)]
Run Code Online (Sandbox Code Playgroud)

如何使用RDD中的scala做到这一点?我使用Spark版本1.6

scala apache-spark rdd

7
推荐指数
2
解决办法
6044
查看次数

标签 统计

apache-spark ×1

rdd ×1

scala ×1