相关疑难解决方法(0)

在pyspark dataframe中显示不同的列值:python

请为Pandas建议pyspark数据帧替代方案df['col'].unique().

我想列出pyspark数据帧列中的所有唯一值.

不是SQL类型的方式(registertemplate然后SQL查询不同的值).

我也不需要groupby->countDistinct,而是想检查该列中的不同VALUES.

pyspark pyspark-sql

65
推荐指数

6
解决办法

12万
查看次数

Spark DataFrame:计算每列的不同值

问题几乎在标题中:是否有一种有效的方法来计算DataFrame中每列中的不同值？

该描述方法只提供了计数,但不重复计数,我不知道是否有AA的方式来获得所有的重复计数(或选择)列.

distinct-values apache-spark apache-spark-sql

20
推荐指数

4
解决办法

4万
查看次数

标签统计

apache-spark ×1

apache-spark-sql ×1

distinct-values ×1

pyspark-sql ×1