Mat*_*s12 2 python k-means pandas data-science
我正在尝试对来自不同公司的产品销售的数据进行聚类。请注意,我将列中的任何字符串映射到数值,以便我可以使用 k 均值聚类。我有以下代码,我在我的数据上做 k-means
FeaturesDf=FeaturesDf[['company_value','Date_value','product_value']]
# Convert DataFrame to matrix
mat = FeaturesDf.values
#Using sklearn
km = sklearn.cluster.KMeans(n_clusters=5)
km.fit(mat)
# Get cluster assignment labels
labels = km.labels_
# Format results as a DataFrame
results = pd.DataFrame(data=labels, columns=['cluster'], index=orderFeaturesDf.index)
Run Code Online (Sandbox Code Playgroud)
我如何绘制一个 k 均值聚类图?我试过
plt.scatter(results.index,results['cluster'], c='black')
plt.plot(results)
Run Code Online (Sandbox Code Playgroud)
但是有没有更好的方法来做到这一点?
与您所做的相同,但您可以调用plot.scatterDataFrame 本身:
import pandas as pd
import numpy as np
from sklearn.cluster import KMeans
n = 1000
d = pd.DataFrame({
'x': np.random.randint(0,100,n),
'y': np.random.randint(0,100,n),
})
m = KMeans(5)
m.fit(d)
d['cl'] = m.labels_
d.plot.scatter('x', 'y', c='cl', colormap='gist_rainbow')
Run Code Online (Sandbox Code Playgroud)
输出: