ana*_*ngh -3 python cluster-analysis scikit-learn
编辑这个问题的时候对聚类技术的了解很少,现在事后看来甚至不符合Stack Overflow网站的标准,但是我不会让我删除它,说其他人已经在这个(有效点)上投入了时间和精力,如果我继续删除,我可能暂时无法提出问题了,因此,我正在更新此问题,以使其与其他人可以借鉴的方式相关。仍然严格不遵循SO准则,因为我本人会将此标记为过于广泛,但是在当前状态下它没有任何价值,因此为其添加一点价值将是值得的。
更新的会话主题
“问题”是在聚类算法中选择最佳聚类数,该聚类算法会将各种形状分组,这些形状是图像上轮廓检测的输入,然后将聚类属性的偏差标记为“噪波”或“异常”。当时提出这个问题的要点是,所有数据集都是不同的,在它们中获得的形状也不同,并且每个数据集的形状编号也将有所不同。正确的解决方案是继续使用DBSCAN(带有噪声的基于密度的空间聚类应用程序)应用程序,该应用程序scikit-learn
当时我还没有意识到,可以正常工作,现在该产品正在测试中,我只是想回到此并纠正这个旧错误。
旧问题
旧标题 kmeans聚类中k的动态选择
我必须生成一个k-means聚类模型,其中事先不知道类的数量,有没有一种方法可以根据聚类内的欧式距离自动确定k的值。
我希望它如何工作。从k的值开始,执行聚类,查看其是否满足阈值标准并相应地增加或减少k。问题是与框架无关的,如果您有使用Python以外的语言编写的Idea或实现,请也分享。
我在研究问题https://www.researchgate.net/publication/267752474_Dynamic_Clustering_of_Data_with_Modified_K-Means_Algorithm时发现了这个问题。我找不到它的实现。
我正在寻找类似的想法来选择最好的并自己实现,或者可以移植到我的代码中的实现。
编辑我现在正在考虑的想法是:
肘法
X-均值聚类
归档时间: |
|
查看次数: |
482 次 |
最近记录: |