小编Kir*_*ran的帖子

如何在 pyspark datafarme 中查找重复的列值

我正在尝试从 pyspark 中的数据帧中查找重复的列值。

例如,我有一个包含单列“A”的数据框,其值如下:

==
A
==
1
1
2
3
4
5
5
Run Code Online (Sandbox Code Playgroud)

我期待如下输出(仅需要重复的值)

==
A
==
1
5
Run Code Online (Sandbox Code Playgroud)

find duplicates pyspark

5
推荐指数
2
解决办法
1万
查看次数

标签 统计

duplicates ×1

find ×1

pyspark ×1