小编Pet*_*hor的帖子

如何将向量列拆分为两列?

我使用PySpark.

Spark ML的随机森林输出DataFrame有一列"概率",它是一个具有两个值的向量.我只想两列添加到输出数据帧,"prob1"和"prob2",其对应于载体中的第一和第二值.

我尝试过以下方法:

output2 = output.withColumn('prob1', output.map(lambda r: r['probability'][0]))
Run Code Online (Sandbox Code Playgroud)

但我得到'col应该是列'的错误.

关于如何将一列向量转换为其值列的任何建议?

apache-spark pyspark apache-spark-ml

5
推荐指数
1
解决办法
2885
查看次数

标签 统计

apache-spark ×1

apache-spark-ml ×1

pyspark ×1