小编Lea_nis的帖子

take(10) 与 limit(10).collect() 的性能比较

我有一个包含十亿条记录的数据框，我想从中取出 10 条记录。

哪种方法更好更快？

df.take(10)或者df.limit(10).collect()？

scala dataframe apache-spark apache-spark-sql

2
推荐指数

2
解决办法

818
查看次数

标签统计

apache-spark ×1

apache-spark-sql ×1