小编Qma*_*age的帖子

dropDuplicates运算符中使用了哪一行?

当使用dropDuplicatesSpark DF中的功能时,将保留哪一行?Spark文档中没有说明.

  1. 保持第一(根据行顺序)
  2. 保持最后(根据行顺序)
  3. 随机?

PS假设在分布式YARN环境中(不是本地主站)

apache-spark apache-spark-sql pyspark

8
推荐指数
1
解决办法
2185
查看次数

标签 统计

apache-spark ×1

apache-spark-sql ×1

pyspark ×1