小编Pat*_*uff的帖子

在 PySpark 中转置 RowMatrix

您好,我想知道如何在 PySpark 中转置 RowMatrix。

data = [(MLLibVectors.dense([1.0, 2.0]), ), (MLLibVectors.dense([3.0, 4.0]), )]

df=sqlContext.createDataFrame(data, ["features"])
features=df.select("features").rdd.map(lambda row: row[0])

mat=RowMatrix(features)
print mat.rows.first()
#[1.0,2.0]

mat=mat.Transpose()

print mat.rows.first()
#[1.0,3.0]
Run Code Online (Sandbox Code Playgroud)

有人用Python实现这个吗?我看过类似的帖子,但一切都在 Scala 中。谢谢。

python apache-spark pyspark

4
推荐指数
1
解决办法
2741
查看次数

标签 统计

apache-spark ×1

pyspark ×1

python ×1