在scikit中使用libsvm格式

bab*_*ney 3 machine-learning pca libsvm scikit-learn

我对所有这些工具都很陌生.我一直在使用libsvm并想使用scikit.但我的所有输入都是libsvm格式.像这样的东西

 +1 1:1 36:1
 +1 1:1 11:1 25:1 36:1
Run Code Online (Sandbox Code Playgroud)

我使用load_svmlight_files函数加载,加载后我加载的训练数据看起来像这样(1,0)1.0(1,35)1.0(2,0)1.0(2,10)1.0(2,24)1.0(2, 35)1.0

但是当我尝试使用pylab散布它返回时

   ValueError: setting an array element with a sequence.
Run Code Online (Sandbox Code Playgroud)

如何将我的数据更改为scikit二维数组?

ogr*_*sel 6

sklearn.datasets.load_svmlight_file将数据作为scipy.sparseCSR矩阵加载,而matplotlib散点图需要一个numpy数组.您认为将稀疏数据实现为密集的numpy数组将适合内存,您可以.toarray()在其上调用方法.

散点图也只对2D阵列数据有意义.