我有一个pyspark数据帧
DOCTOR | PATIENT
JOHN | SAM
JOHN | PETER
JOHN | ROBIN
BEN | ROSE
BEN | GRAY
Run Code Online (Sandbox Code Playgroud)
并需要按行连接患者姓名,以便我得到如下输出:
DOCTOR | PATIENT
JOHN | SAM, PETER, ROBIN
BEN | ROSE, GRAY
Run Code Online (Sandbox Code Playgroud)
有人可以帮助我在pyspark中创建这个数据帧吗?
提前致谢.