混合变量(分类和数字)距离函数

Mar*_*iya 9 cluster-analysis distance data-mining

我想模糊集群一组工作. 工作属性是:

  1. 分类:职位,文凭,技能
  2. 数值:薪水,多年的经验

我的问题是:如何计算不同工作之间的距离?
例如job1(程序员,计算机科学,(java,.net,责任),1500,3)
job2(测试员,bs计算机科学,(黑白盒测试),1200,1)

PS:我是数据挖掘集群的初学者,我非常感谢你的帮助.

iin*_*ion 3

您可以以此为起点: http://www.econ.upf.edu/~michael/stanford/maeb4.pdf。最后很好地解释了分类数据之间的距离。