生成数值概念层次的算法

Chr*_*man 8 algorithm artificial-intelligence machine-learning

我有几个数字数据集,我需要创建一个概念层次结构.现在,我一直在通过观察数据(和相应的线图)手动完成此操作.基于我的直觉,我创建了一些可接受的层次结构.

这似乎是一项可以自动化的任务.有谁知道是否有算法为数值数据生成概念层次结构?


举个例子,我有以下数据集:

Bangladesh     521
Brazil         8295
Burma          446
China          3259
Congo          2952
Egypt          2162
Ethiopia       333
France         46037
Germany        44729
India          1017
Indonesia      2239
Iran           4600
Italy          38996
Japan          38457
Mexico         10200
Nigeria        1401
Pakistan       1022
Philippines    1845
Russia         11807
South Africa   5685
Thailand       4116
Turkey         10479
UK             43734
US             47440
Vietnam        1042
Run Code Online (Sandbox Code Playgroud)

替代文字http://i40.tinypic.com/fd7xxu.jpg

为此我创建了以下层次结构:

  • 最低(<1000)
  • 低(1000 - 2500)
  • 中等(2501 - 7500)
  • 高(7501 - 30000)
  • 最高(> 30000)

Eli*_*sky 5

也许你需要一个聚类算法?

引用链接:

聚类分析或聚类是将一组观察分配到子集(称为聚类)中,以便在同一聚类中的观察在某种意义上是相似的.聚类是一种无监督学习的方法,也是许多领域中使用的统计数据分析的常用技术