joh*_*tah 2 r cluster-analysis hierarchical-clustering igraph
我有一个交互网络,我使用以下代码制作邻接矩阵,然后计算网络节点之间的相异度,然后将它们聚类以形成模块:
ADJ1=abs(adjacent-mat)^6
dissADJ1<-1-ADJ1
hierADJ<-hclust(as.dist(dissADJ1), method = "average")
Run Code Online (Sandbox Code Playgroud)
现在我希望在绘制 igraph 时出现这些模块。
g<-simplify(graph_from_adjacency_matrix(adjacent-mat, weighted=T))
plot.igraph(g)
Run Code Online (Sandbox Code Playgroud)
但是,到目前为止,我发现将 hclust 输出转换为图形的唯一方法是按照以下教程:http ://gastonsanchez.com/resources/2014/07/05/Pretty-tree-graph/
phylo_tree = as.phylo(hierADJ)
graph_edges = phylo_tree$edge
graph_net = graph.edgelist(graph_edges)
plot(graph_net)
Run Code Online (Sandbox Code Playgroud)
这对分层沿袭很有用,但我只想要与集群密切交互的节点,如下所示:
任何人都可以推荐如何使用命令(例如 igraph 中的组件)来显示这些集群?
igraph 提供了一系列不同的布局算法,用于在图中放置节点。
对于像这样的加权网络来说,一个好的开始是力导向布局(layout.fruchterman.reingold
在 igraph 中实现)。
下面是使用一些简单的模拟数据使用力导向布局的示例。
首先,我们创建一些模拟数据和集群,以及一些“噪音”以使其更逼真:
library('dplyr')
library('igraph')
library('RColorBrewer')
set.seed(1)
# generate a couple clusters
nodes_per_cluster <- 30
n <- 10
nvals <- nodes_per_cluster * n
# cluster 1 (increasing)
cluster1 <- matrix(rep((1:n)/4, nodes_per_cluster) +
rnorm(nvals, sd=1),
nrow=nodes_per_cluster, byrow=TRUE)
# cluster 2 (decreasing)
cluster2 <- matrix(rep((n:1)/4, nodes_per_cluster) +
rnorm(nvals, sd=1),
nrow=nodes_per_cluster, byrow=TRUE)
# noise cluster
noise <- matrix(sample(1:2, nvals, replace=TRUE) +
rnorm(nvals, sd=1.5),
nrow=nodes_per_cluster, byrow=TRUE)
dat <- rbind(cluster1, cluster2, noise)
colnames(dat) <- paste0('n', 1:n)
rownames(dat) <- c(paste0('cluster1_', 1:nodes_per_cluster),
paste0('cluster2_', 1:nodes_per_cluster),
paste0('noise_', 1:nodes_per_cluster))
Run Code Online (Sandbox Code Playgroud)
接下来,我们可以使用Pearson 相关来构建我们的邻接矩阵:
# create correlation matrix
cor_mat <- cor(t(dat))
# shift to [0,1] to separate positive and negative correlations
adj_mat <- (cor_mat + 1) / 2
# get rid of low correlations and self-loops
adj_mat <- adj_mat^3
adj_mat[adj_mat < 0.5] <- 0
diag(adj_mat) <- 0
Run Code Online (Sandbox Code Playgroud)
使用hclust
和对数据进行聚类cutree
:
# convert to dissimilarity matrix and cluster using hclust
dissim_mat <- 1 - adj_mat
dend <- dissim_mat %>%
as.dist %>%
hclust
clusters = cutree(dend, h=0.65)
# color the nodes
pal = colorRampPalette(brewer.pal(11,"Spectral"))(length(unique(clusters)))
node_colors <- pal[clusters]
Run Code Online (Sandbox Code Playgroud)
最后,从邻接矩阵创建一个 igraph 图并使用fruchterman.reingold
布局绘制它:
# create graph
g <- graph.adjacency(adj_mat, mode='undirected', weighted=TRUE)
# set node color and plot using a force-directed layout (fruchterman-reingold)
V(g)$color <- node_colors
coords_fr = layout.fruchterman.reingold(g, weights=E(g)$weight)
# igraph plot options
igraph.options(vertex.size=8, edge.width=0.75)
# plot network
plot(g, layout=coords_fr, vertex.color=V(g)$color)
Run Code Online (Sandbox Code Playgroud)
在上面的代码中,我生成了两个相关行的“集群”和第三组“噪声”。
分层聚类 ( hclust
+ cuttree
) 用于将数据点分配给聚类,并根据聚类成员资格对它们进行着色。
结果如下所示:
有关使用 igraph 聚类和绘制图形的更多示例,请查看:http : //michael.hahsler.net/SMU/LearnROnYourOwn/code/igraph.html