揭示 igraph 中的交互集群

joh*_*tah 2 r cluster-analysis hierarchical-clustering igraph

我有一个交互网络,我使用以下代码制作邻接矩阵,然后计算网络节点之间的相异度,然后将它们聚类以形成模块:

ADJ1=abs(adjacent-mat)^6
dissADJ1<-1-ADJ1
hierADJ<-hclust(as.dist(dissADJ1), method = "average")
Run Code Online (Sandbox Code Playgroud)

现在我希望在绘制 igraph 时出现这些模块。

g<-simplify(graph_from_adjacency_matrix(adjacent-mat, weighted=T))
plot.igraph(g)
Run Code Online (Sandbox Code Playgroud)

但是,到目前为止,我发现将 hclust 输出转换为图形的唯一方法是按照以下教程:http ://gastonsanchez.com/resources/2014/07/05/Pretty-tree-graph/

phylo_tree = as.phylo(hierADJ)
graph_edges = phylo_tree$edge
graph_net = graph.edgelist(graph_edges)
plot(graph_net)
Run Code Online (Sandbox Code Playgroud)

在此处输入图片说明

这对分层沿袭很有用,但我只想要与集群密切交互的节点,如下所示:

在此处输入图片说明

任何人都可以推荐如何使用命令(例如 igraph 中的组件)来显示这些集群?

Kei*_*itt 5

igraph 提供了一系列不同的布局算法,用于在图中放置节点。

对于像这样的加权网络来说,一个好的开始是力导向布局layout.fruchterman.reingold在 igraph 中实现)。

下面是使用一些简单的模拟数据使用力导向布局的示例。

首先,我们创建一些模拟数据和集群,以及一些“噪音”以使其更逼真:

library('dplyr')
library('igraph')
library('RColorBrewer')

set.seed(1)

# generate a couple clusters
nodes_per_cluster <- 30
n <- 10

nvals <- nodes_per_cluster * n

# cluster 1 (increasing) 
cluster1 <- matrix(rep((1:n)/4, nodes_per_cluster) + 
                   rnorm(nvals, sd=1),
                   nrow=nodes_per_cluster, byrow=TRUE)

# cluster 2 (decreasing)
cluster2 <- matrix(rep((n:1)/4, nodes_per_cluster) + 
                   rnorm(nvals, sd=1),
                   nrow=nodes_per_cluster, byrow=TRUE)

# noise cluster
noise <- matrix(sample(1:2, nvals, replace=TRUE) +
                rnorm(nvals, sd=1.5),
                nrow=nodes_per_cluster, byrow=TRUE)

dat <- rbind(cluster1, cluster2, noise)
colnames(dat) <- paste0('n', 1:n)
rownames(dat) <- c(paste0('cluster1_', 1:nodes_per_cluster), 
                   paste0('cluster2_', 1:nodes_per_cluster),
                   paste0('noise_',    1:nodes_per_cluster))
Run Code Online (Sandbox Code Playgroud)

接下来,我们可以使用Pearson 相关来构建我们的邻接矩阵:

# create correlation matrix
cor_mat <- cor(t(dat))

# shift to [0,1] to separate positive and negative correlations
adj_mat <- (cor_mat + 1) / 2

# get rid of low correlations and self-loops
adj_mat <- adj_mat^3
adj_mat[adj_mat < 0.5] <- 0
diag(adj_mat) <- 0
Run Code Online (Sandbox Code Playgroud)

使用hclust和对数据进行聚类cutree

# convert to dissimilarity matrix and cluster using hclust
dissim_mat <- 1 - adj_mat

dend <- dissim_mat %>% 
    as.dist %>% 
    hclust

clusters = cutree(dend, h=0.65)

# color the nodes
pal = colorRampPalette(brewer.pal(11,"Spectral"))(length(unique(clusters)))
node_colors <- pal[clusters]
Run Code Online (Sandbox Code Playgroud)

最后,从邻接矩阵创建一个 igraph 图并使用fruchterman.reingold布局绘制它:

# create graph
g <- graph.adjacency(adj_mat, mode='undirected', weighted=TRUE)

# set node color and plot using a force-directed layout (fruchterman-reingold)
V(g)$color <- node_colors
coords_fr = layout.fruchterman.reingold(g, weights=E(g)$weight)

# igraph plot options
igraph.options(vertex.size=8, edge.width=0.75) 

# plot network
plot(g, layout=coords_fr, vertex.color=V(g)$color)
Run Code Online (Sandbox Code Playgroud)

在上面的代码中,我生成了两个相关行的“集群”和第三组“噪声”。

分层聚类 ( hclust+ cuttree) 用于将数据点分配给聚类,并根据聚类成员资格对它们进行着色。

结果如下所示:

在此处输入图片说明

有关使用 igraph 聚类和绘制图形的更多示例,请查看:http : //michael.hahsler.net/SMU/LearnROnYourOwn/code/igraph.html