我一直在研究k-means聚类,有一点不清楚你是如何选择k的值的.这只是一个反复试验的问题,还是有更多的问题?
cluster-analysis k-means
我试图在一组高维数据点(大约50维)上应用k-means,并且想知道是否有任何实现找到最佳簇数.
我记得在某处读取算法通常这样做的方式是使群集间距离最大化并且群集内距离最小化但我不记得我在哪里看到它.如果有人可以指出我讨论这个的任何资源,那将是很棒的.我目前正在使用SciPy进行k-means,但任何相关的库都可以.
如果有其他方法可以实现相同或更好的算法,请告诉我.
python machine-learning data-mining k-means
可能重复: 使用k-means聚类时如何确定k?
如果我不知道数据,我怎么能最初选择K?
有人可以帮我选择K.
谢谢纳文
data-mining k-means
k-means ×3
data-mining ×2
cluster-analysis ×1
machine-learning ×1
python ×1