将稀疏矩阵写入 csv 时遇到问题

Wal*_*ams 5 python csv numpy python-2.7 export-to-csv

我是 Python 新手,我正在尝试将矩阵中的数据写入 CSV 文件。该变量定义为:

(Pdb) trainFeatures
<1562936x312116 sparse matrix of type '<type 'numpy.float64'>'
with 43753231 stored elements in Compressed Sparse Row format>
Run Code Online (Sandbox Code Playgroud)

我有一行代码:

numpy.savetxt("feature_train.csv", trainFeatures, delimiter=',')
Run Code Online (Sandbox Code Playgroud)

当我运行该行时,我收到一条错误消息:

ncol = X.shape[1]
IndexError: tuple index out of range
Run Code Online (Sandbox Code Playgroud)

我确信矩阵的格式不正确,但我不知道如何得到它。谁能指出我需要在这里做什么?

woo*_*919 3

好的,要完成这个过程,原始问题的答案是使用 todense() 方法将 trainFeatures 转换为 savetxt() 识别的格式。但要对内存不足进行进一步评论,明显的解决方案是使用 getrow() 方法并迭代所有行并将每一行单独写入文件,而不是尝试一次性完成整个矩阵。