相关疑难解决方法(0)

如何单独打印特定分区的元素,比如说第5个？

val distData = sc.parallelize(1 to 50, 10)

9
推荐指数

1
解决办法

1万
查看次数

我找不到只参与rdd. take看起来很有希望，但它返回一个list而不是rdd. 我当然可以将其转换为rdd，但这似乎既浪费又丑陋。

 my_rdd = sc.textFile("my_file.csv")
 part_of_my_rdd = sc.parallelize(my_rdd.take(10000))

我有更好的方法来做到这一点吗？

5
推荐指数

1
解决办法

2927
查看次数

rdd ×1