小编Lea*_*nis的帖子

take(10) 与 limit(10).collect() 的性能比较

我有一个包含十亿条记录的数据框,我想从中取出 10 条记录。

哪种方法更好更快?

df.take(10)或者df.limit(10).collect()

scala dataframe apache-spark apache-spark-sql

2
推荐指数
2
解决办法
818
查看次数

标签 统计

apache-spark ×1

apache-spark-sql ×1

dataframe ×1

scala ×1