在1-d数据上使用什么聚类算法？

Question

我有一个数组列表中的数字.每个元素的索引是X,值是Y.我如何分区/聚类这些数据？如果我有一个数组,我只想要一组标记每个分区结束的值.由于我正在使用Python,请提及是否有库可以执行相同操作.

谢谢.

Answer 1

K-Means是一个非常简单的聚类算法,我会说在进行更复杂的事情之前先进行测试.K-Means算法http://en.wikipedia.org/wiki/K-means_clustering

如果您对K-Means不满意,那么您使用EM算法和高斯混合(http://en.wikipedia.org/wiki/Mixture_model),不太难编码,您可以使用K-Means来初始化它!

这些已经在Python中实现了100次,检查任何机器学习工具箱.

SciPy在其集群包中非常友好地实现了kmeans.事实上我今天只是在使用它,而我现在恰好在另一个标签中提供了文档:http://docs.scipy.org/doc/scipy/reference/cluster.vq.html (5认同)
**不要在1-d数据上使用k-means.使用优化的1-d技术.** (2认同)