小编use*_*088的帖子

我在哪里可以找到一组带有地面实况标签的基准聚类数据集?

我正在寻找具有"基础事实"标签的聚类数据集,用于某些已知的自然聚类,最好具有高维度.

我在这里找到了一些好的候选人(http://cs.joensuu.fi/sipu/datasets/),但只有Glass和Iris数据集有点标签.我还发现了一些生成高斯数据集(SynDECA)的代码.我想要的主要原因是比较一些聚类方法的距离度量.使用外部(外在)评估标准很困难,因为其中许多偏向于欧氏距离; 而且有很多可供选择.

谢谢!

benchmarking cluster-analysis machine-learning hierarchical-clustering dataset

6
推荐指数
1
解决办法
2399
查看次数