Mat*_*t W 9 algorithm artificial-intelligence data-mining
有没有人知道在离散和连续属性上执行聚类的好算法?我正在研究识别一组类似客户的问题,每个客户都有离散和连续的属性(思考客户类型,该客户产生的收入金额,地理位置等).
传统上像K-means或EM这样的算法用于连续属性,如果我们混合了连续属性和离散属性呢?
如果我没记错的话,那么COBWEB算法可以使用离散属性.
您还可以对离散属性执行不同的"技巧",以创建有意义的距离度量.
你可以google进行分类/离散属性的聚类,这是第一次点击之一:ROCK:一种用于分类属性的鲁棒聚类算法.