tum*_*eed 9 python machine-learning weka arff scikit-learn
我想使用带有scikit-learn 的属性 - 关系文件格式来做一些NLP任务,这可能吗?如何使用.arff文件scikit-learn?
ren*_*opp 20
我真的推荐liac-arff.它不直接加载到numpy,但转换很简单:
import arff, numpy as np
dataset = arff.load(open('mydataset.arff', 'rb'))
data = np.array(dataset['data'])
Run Code Online (Sandbox Code Playgroud)
解决方案与scipy.arff
代码:
from scipy.io import arff
import pandas as pd
data = arff.loadarff('file.arff')
df = pd.DataFrame(data[0])
df.head()
Run Code Online (Sandbox Code Playgroud)