如果我有以下几点:
mm <- matrix(0, 4, 3)
mm<-apply(mm, c(1, 2), function(x) sample(c(0, 1), 1))
> mm
[,1] [,2] [,3]
[1,] 1 1 1
[2,] 1 1 0
[3,] 0 0 0
[4,] 1 0 1
Run Code Online (Sandbox Code Playgroud)
如何输出一个矩阵,该矩阵表示两个值都为 1 的不同列的频率或百分比。例如 - 4 中有两行,其中第 1 列和第 2 列都等于 1 (=0.5) 和 4 中的 1 行其中第 2 列和第 3 列 = 1 (=0.25),所以在这种情况下我需要:
[,1] [,2] [,3]
[1,] 1 0.5 0.5
[2,] 0.5 1 0.25
[3,] 0.5 0.25 1
Run Code Online (Sandbox Code Playgroud)
我对比较相同的列不感兴趣,所以默认情况下对角线保持在 1。
我想我可能会在某个cor(mm)地方有办法输出共同频率或共同百分比而不是相关系数,但情况似乎并非如此。但是最终输出的维度应该是一个 N x N 列矩阵作为 cor() 输出:
> cor(mm)
[,1] [,2] [,3]
[1,] 1.0000000 0.5773503 0.5773503
[2,] 0.5773503 1.0000000 0.0000000
[3,] 0.5773503 0.0000000 1.0000000
Run Code Online (Sandbox Code Playgroud)
但显然这些是相关系数,我只想用共同频率或共同百分比代替。
一个基本的 R 解决方案正在使用crossprod,即,
r <- `diag<-`(crossprod(mm)/nrow(mm),1)
Run Code Online (Sandbox Code Playgroud)
以至于
> r
[,1] [,2] [,3]
[1,] 1.0 0.50 0.50
[2,] 0.5 1.00 0.25
[3,] 0.5 0.25 1.00
Run Code Online (Sandbox Code Playgroud)
数据
mm <- structure(c(1, 1, 0, 1, 1, 1, 0, 0, 1, 0, 0, 1), .Dim = 4:3)
Run Code Online (Sandbox Code Playgroud)