Nig*_* Ng 4 python apache-spark apache-spark-sql pyspark apache-spark-ml
我有一个方形的 pyspark RowMatrix,如下所示:
>>> row_mat.numRows()
100
>>> row_mat.numCols()
100
>>> row_mat.rows.first()
SparseVector(100, {0: 0.0, 1: 0.0018, 2: 0.1562, 3: 0.0342...})
Run Code Online (Sandbox Code Playgroud)
我想运行pyspark.ml.feature.PCA,但它的fit()方法只接受 a DataFrame。有没有办法将其转换RowMatrix为DataFrame?
或者有更好的方法吗?
| 归档时间: |
|
| 查看次数: |
2555 次 |
| 最近记录: |