在您尝试过的各种方法中,例如df.select('column').distinct()等df.groupby('column').count(),从列中提取不同值的最有效方法是什么?
df.select('column').distinct()
df.groupby('column').count()
apache-spark apache-spark-sql pyspark
apache-spark ×1
apache-spark-sql ×1
pyspark ×1