我有一个包含十亿条记录的数据框,我想从中取出 10 条记录。
哪种方法更好更快?
df.take(10)或者df.limit(10).collect()?
df.take(10)
df.limit(10).collect()
scala dataframe apache-spark apache-spark-sql
apache-spark ×1
apache-spark-sql ×1
dataframe ×1
scala ×1