带scikit-learn的.arff文件?

tum*_*eed 9 python machine-learning weka arff scikit-learn

我想使用带有scikit-learn 的属性 - 关系文件格式来做一些NLP任务,这可能吗?如何使用.arff文件scikit-learn

ren*_*opp 20

我真的推荐liac-arff.它不直接加载到numpy,但转换很简单:

import arff, numpy as np
dataset = arff.load(open('mydataset.arff', 'rb'))
data = np.array(dataset['data'])
Run Code Online (Sandbox Code Playgroud)


ogr*_*sel 7

我发现scipy有一个arff文件的加载器来加载它们作为numpy记录数组.我不是100%确定这些数组适合scikit-learn直接使用,但这应该让你开始.


Sye*_*aan 6

解决方案与scipy.arff

代码:


from scipy.io import arff
import pandas as pd

data = arff.loadarff('file.arff')
df = pd.DataFrame(data[0])
df.head()
Run Code Online (Sandbox Code Playgroud)