将数据框转换为邻接矩阵/边列表以进行网络分析

Sim*_*tts 2 networking r matrix adjacency-matrix network-analysis

我正在尝试将数据框从在线论坛转换为社交网络,但是我不知道如何将数据转换为网络分析所需的邻接矩阵/边列表。

我的代码如下:

library(igraph)  
graph.data.2002 <- as.matrix(data.2002[,2:3])  
g.2002 <- graph.data.frame(graph.data.2002, directed=FALSE)  
plot(g.2002, vertex.size = 1, vertex.label=NA)  
Run Code Online (Sandbox Code Playgroud)

我正在使用 R 进行分析。目前的问题是作者之间是通过ThreadID联系起来的,但是在进行网络分析时,它包含了ThreadID作为一个节点。理想情况下,我想要一个邻接矩阵/边缘列表,如果作者与同一线程上的所有作者交互,则显示 1。

(第一次发帖,如果有什么遗漏/不正确的地方,请告诉我)

目前数据如下:

ThreadID    AuthorID
659289  193537
432269  136196
572531  170305
230003  32359
459059  47875
635953  181593
235116  51993
Run Code Online (Sandbox Code Playgroud)

小智 5

您可以使用 aninner_join来获取诸如边缘列表之类的东西(只需要进行一些轻微的重新格式化)。

如果我理解正确,test 1应该只有一个联系,作者 193537 和 32359 在线程 659289 上。

test1 <- data.frame(ThreadID = c(659289, 432269, 572531, 659289),
                 AuthorID = c(193537, 136196, 170305, 32359))
test2 <- dplyr::inner_join(test1, test1, by = "ThreadID")[,-1]
test3 <- apply(test2, 2, as.character) #AuthorID as character will become vertex ID
Run Code Online (Sandbox Code Playgroud)

检查您是否得到了预期的结果:

library(network)
test.network <- network(test3, directed = FALSE)
as.sociomatrix(test.network)
as.edgelist(test.network)
plot(test.network, label = test.network%v%"vertex.names")
Run Code Online (Sandbox Code Playgroud)