相关疑难解决方法(0)

在pyspark dataframe中显示不同的列值:python

请为Pandas建议pyspark数据帧替代方案df['col'].unique().

我想列出pyspark数据帧列中的所有唯一值.

不是SQL类型的方式(registertemplate然后SQL查询不同的值).

我也不需要groupby->countDistinct,而是想检查该列中的不同VALUES.

pyspark pyspark-sql

65
推荐指数
6
解决办法
12万
查看次数

Spark DataFrame:计算每列的不同值

问题几乎在标题中:是否有一种有效的方法来计算DataFrame中每列中的不同值?

描述方法只提供了计数,但不重复计数,我不知道是否有AA的方式来获得所有的重复计数(或选择)列.

distinct-values apache-spark apache-spark-sql

20
推荐指数
4
解决办法
4万
查看次数