ogr*_*sel 6

scikit-learn中有一个:

http://scikit-learn.org/stable/modules/generated/sklearn.datasets.dump_svmlight_file.html

它是基本的,但它适用于numpy数组和scipy.sparse矩阵.


lev*_*que 5

我刚才写了这个完全未经优化的脚本,也许它可以提供帮助!数据和标签必须位于两个单独的numpy数组中.

def save_svmlight_data(data, labels, data_filename, data_folder = ''):
    file = open(data_folder+data_filename,'w')

    for i,x in enumerate(data):
        indexes = x.nonzero()[0]
        values = x[indexes]

        label = '%i'%(labels[i])
        pairs = ['%i:%f'%(indexes[i]+1,values[i]) for i in xrange(len(indexes))]

        sep_line = [label]
        sep_line.extend(pairs)
        sep_line.append('\n')

        line = ' '.join(sep_line)

        file.write(line)
Run Code Online (Sandbox Code Playgroud)


jte*_*ace 1

svmlight-loader模块可以将 svmlight 文件加载到 numpy 数组中。我认为其他方向不存在任何东西,但该模块可能是扩展其功能的一个很好的起点。