ONe*_*MB1 5 r hclust phylogeny
我想使用 cutree() 函数将系统发育树聚类到指定数量的进化枝中。然而, phylo 对象(无根的系统发育树)不是 unltrametric,因此在使用 as.hclust.phylo() 时会返回错误。目标是在保留最大多样性的同时对树的尖端进行子采样,因此希望按指定数量的进化枝进行聚类(然后从每个进化枝中随机采样一个)。这将对具有不同数量所需样本的许多树进行。将无根树强制转换为 hclust 对象的任何帮助,或有关将树(系统对象)系统地折叠为预定义数量的进化枝的不同方法的建议,将不胜感激。
library("ape")
library("ade4")
tree <- rtree(n = 32)
tree.hclust <- as.hclust.phylo(tree)
Run Code Online (Sandbox Code Playgroud)
返回:“as.hclust.phylo(tree) 中的错误:树不是超度量的”
如果我制作所有节点之间的分支长度的距离矩阵,我就可以使用 hclust 来生成集群,然后将 cutree 转换为所需数量的集群:
dm <- cophenetic.phylo(tree)
single <- hclust(as.dist(dm), method="single")
cutSingle <- as.data.frame(cutree(single, k=10))
color <- cutSingle[match(tree$tip.label, rownames(cutSingle)), 'cutree(single, k = 10)']
plot.phylo(tree, tip.color=color)
Run Code Online (Sandbox Code Playgroud)
然而,结果并不理想,因为非常基础的分支聚集在一起。基于树结构的聚类,或者尖端到根的距离将是更可取的。
任何建议表示赞赏!
| 归档时间: |
|
| 查看次数: |
883 次 |
| 最近记录: |