问题几乎在标题中:是否有一种有效的方法来计算DataFrame中每列中的不同值?
该描述方法只提供了计数,但不重复计数,我不知道是否有AA的方式来获得所有的重复计数(或选择)列.
distinct-values apache-spark apache-spark-sql
apache-spark ×1
apache-spark-sql ×1
distinct-values ×1