我正在尝试从 pyspark 中的数据帧中查找重复的列值。
例如,我有一个包含单列“A”的数据框,其值如下:
== A == 1 1 2 3 4 5 5
我期待如下输出(仅需要重复的值)
== A == 1 5
find duplicates pyspark
duplicates ×1
find ×1
pyspark ×1