小编Ran*_*thy的帖子

当我有一个数据帧时如何使用Scikit kmeans

我已将数据集转换为数据帧.我想知道如何在scikit kmeans中使用它,或者是否有任何其他kmeans包可用.

import csv
import codecs
import pandas as pd
import sklearn
from sklearn import cross_validation
from sklearn.cross_validation import train_test_split
sample_df = pd.read_csv('sample.csv',sep='\t',keep_default_na=False, na_values=[""])
print sample_df['Polarity']
print sample_df['Gravity']
print sample_df['Sense']
print sample_df[['Polarity','Gravity']]
sklearn.cluster.KMeans(n_clusters=8, init='k-means++', n_init=10, max_iter=300, tol=0.0001, precompute_distances='auto', verbose=0, random_    state=None, copy_x=True, n_jobs=1)

Run Code Online (Sandbox Code Playgroud)

除了对火车/测试分裂的友好帮助之外.提前致谢.

python k-means scikit-learn

Ran*_*thy

lucky-day

2
推荐指数

1
解决办法

2775
查看次数