YNr*_*YNr 5 python cluster-analysis scikit-learn
我已经看到了用于聚类的高斯混合的 Scikit-Learn 示例。在这个例子(以及这个模型的其他例子)中,看起来数据总是有两个维度:
plt.scatter(X[:, 0], X[:, 1], s=10, color=colors[y_pred])
Run Code Online (Sandbox Code Playgroud)
我使用以下脚本( X 实际上有超过 2 列),
clf = mixture.GaussianMixture(n_components=2, covariance_type='full')
clf.fit(X)
y_pred = clf.predict(X)
colors = np.array(list(islice(cycle(['#377eb8', '#ff7f00', '#4daf4a',
'#f781bf', '#a65628', '#984ea3',
'#999999', '#e41a1c', '#dede00']),
int(max(y_pred) + 1))))
plt.scatter(X[:, 0], X[:, 1], s=10, color=colors[y_pred])
plt.show()
Run Code Online (Sandbox Code Playgroud)
如何可视化集群和数据点?