我想在R中评估和比较我的社区检测算法的结果。我的算法不允许重叠,并且有一些节点没有被处理。例如,对于 Zachary Karate 俱乐部,我有 1 个节点未治疗。我找到了很多指标(NMI、ARI、Modulaity(Q)、纯度、Rank Index...),但我不知道哪些是最好的。目前,我正在使用模块化、纯度和排名索引。
这些选择的评估指标是否足够?
例如,对于排名索引为 RI(P,R)= (a+d)/(a+b+c+d),其中 a、b、c 和 d 分别是位于根据 P 和 R 在同一社区中,根据 P 在同一社区中但根据 R 在不同社区中,在 P 给定的不同社区中但根据 R 给定的同一社区中,以及根据 P 和 R 两者在不同社区中R, 且 P = {p1, p2, . 。。, pk} 是应用于图 G =< V,E > 和 R = {r1, r2,... 的社区检测算法的输出。。。, rn} 是真实的社区结构。
那么,如果我处理一个大图,我该如何计算这些值?在哪里可以找到R(真实的社区结构)?
当我尝试阅读政治书籍数据集的 gml 文件时遇到问题。我使用命令:
hh=read.table("polbooks.gml")
Run Code Online (Sandbox Code Playgroud)
Erreur dans scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, : la ligne 2 n'avait pas 2 éléments
当我使用这个时:
library(multiplex)
hh=read.gml("polbooks.gml")
Run Code Online (Sandbox Code Playgroud)
Erreur dans (grep("graphics", edg, fixed = TRUE)[(i - 1)] + 2):(grep("graphics", : argument NA / NaN
我在每个数据集“.gml”中都有这个问题