我使用PySpark.
Spark ML的随机森林输出DataFrame有一列"概率",它是一个具有两个值的向量.我只想两列添加到输出数据帧,"prob1"和"prob2",其对应于载体中的第一和第二值.
我尝试过以下方法:
output2 = output.withColumn('prob1', output.map(lambda r: r['probability'][0]))
Run Code Online (Sandbox Code Playgroud)
但我得到'col应该是列'的错误.
关于如何将一列向量转换为其值列的任何建议?