fpr*_*prd 7 r hierarchical-clustering dendrogram phylogeny
我知道树状图很受欢迎.但是,如果有大量的观察和课程,很难遵循.但是有时我觉得应该有更好的方式呈现相同的东西.我有一个想法,但不知道如何实现它.
考虑以下树形图.
> data(mtcars)
> plot(hclust(dist(mtcars)))
Run Code Online (Sandbox Code Playgroud)

可以将其绘制成散点图.其中两点之间的距离用线绘制,而sperate簇(假设阈值)是彩色的,圆的大小由一些变量的值确定.

And*_*rie 11
您正在描述一种相当典型的聚类分析方法:
代码:
hc <- hclust(dist(mtcars))
cluster <- cutree(hc, k=3)
xy <- data.frame(cmdscale(dist(mtcars)), factor(cluster))
names(xy) <- c("x", "y", "cluster")
xy$model <- rownames(xy)
library(ggplot2)
ggplot(xy, aes(x, y)) + geom_point(aes(colour=cluster), size=3)
Run Code Online (Sandbox Code Playgroud)
接下来发生的事情是,你需要一位熟练的统计学家来帮助解释x和y轴的含义.这通常涉及将数据投影到轴并提取因子载荷.
剧情:

| 归档时间: |
|
| 查看次数: |
2648 次 |
| 最近记录: |