我有一个现有的逻辑,它将 pandas 数据帧转换为元组列表。
list(zip(*[df[c].values.tolist() for c in df]))
其中 df 是 pandas 数据框。
有人请帮我在 pyspark 中实现没有 pandas 的相同逻辑。
apache-spark pyspark
apache-spark ×1
pyspark ×1