你如何比较两个树形图之间的"相似性"(在R中)?

Tal*_*ili 21 statistics tree r dendrogram dendextend

我有两个树形图,我希望相互比较,以找出它们是如何"相似".但我不知道有任何方法可以这样做(更不用说实现它的代码了,比方说,在R中).

任何线索?

更新(2014-09-13):

自从提出这个问题以来,我编写了一个名为dendextend的R包,用于树形图的可视化,操作和比较.此软件包在CRAN上,附带详细的插图.它包括诸如cor_cophenetic,cor_bakers_gammaBk/ Bk_plot.以及tanglegram用于在视觉上比较两棵树的功能.

Ani*_*iko 16

比较树形图与比较层次聚类并不完全相同,因为前者包括分支的长度以及分裂,但我也认为这是一个好的开始.我建议你阅读EB Fowlkes&CL Mallows(1983)."比较两个分层聚类的方法".Journal of the American Statistical Association 78(383):553-584 (link).

他们的方法是基于切割每个级别k的树,得到一个度量Bk,将分组比较为k个簇,然后检查Bkk图.度量Bk基于查看对象对并查看它们是否属于同一群集.

我确信可以根据这种方法编写代码,但首先我们需要知道如何在R中表示树形图.

  • 亲爱的 Aniko,自从我开始这个线程以来,我编写了一个名为 _dendextend_ 的 R 包,其中包含几个比较树状图的函数。具体来说:`cor_cophenetic`、`cor_bakers_gamma` 和`Bk` / `Bk_plot`。该软件包还带有一个详细的插图,解释了这些功能。 (3认同)
  • +1感谢您的链接.这看起来像塔票. (2认同)

Pau*_*aul 5

如您所知,树形图来自层次聚类 - 所以您真正要问的是如何比较两个层次聚类运行的结果.我不知道有哪些标准指标,但我会查看找到的集群数量,并比较类似集群之间的成员资格相似性. 以下是我的同事在聚集苏格兰威士忌时所写的层次聚类的概述.