Python KMeans聚类单词

sad*_*awd 9 python cluster-analysis

我有兴趣在距离测量为Leveshtein的单词列表上执行kmeans聚类.

1)我知道有很多框架,包括具有kmeans实现的scipy和orange.然而,它们都需要某种矢量作为不适合我的数据.

2)我需要一个很好的集群实现.我查看了python-clustering并意识到它不会a)返回每个质心的所有距离的总和,并且b)它没有任何类型的迭代限制或切断,这确保了聚类的质量.python-clustering和daniweb上的聚类算法并不适用于我.

有人能找到我的好lib吗?谷歌不是我的朋友

Cha*_*iam 0

并不是对您的具体问题的真正答案,但我建议您看一下“集体智能编程”。在每一章的末尾,例如聚类,它会转移到描述该主题的所有最佳读物。