数据转换避免了R中的嵌套循环

Con*_*sed 9 r transform nested-loops

我有一个列为6列37行的列联表数据矩阵.我需要应用Chi平方变换来给出行轮廓和柱轮廓以进行对应分析.

不幸的是,我被告知我将需要使用嵌套循环来转换数据并执行CA(而不是在R中使用更合理的方式).我得到了用于嵌套循环的结构:

transformed.data=data0

for (row.index in 1:nrow(data)) {
  for (col.index in 1:ncol(data)) {
    transfomed.data[row.index,col.index]=
       "TRANSFORMATION"[row.index,col.index]
  }
}
Run Code Online (Sandbox Code Playgroud)

根据我的理解,通过使用嵌套循环,它将首先将"TRANSFORMATION"应用于行,然后应用于列.

我想要对数据进行的转换以获取行配置文件:

( X(ij)/ sum(X(i)))/sqrt(sum(X(j)))

虽然我想要对数据进行的转换以获得列配置文件:

( X(ij)/ sum(X(j)))/sqrt(sum(X(i)))

我将在嵌套循环的最后一行输入什么作为我的"TRANSFORMATION",以便输出我想要的配置文件转换.否则,如果我错过了解嵌套循环的要点,请描述它允许我做什么.

这是我的数据子集的代码:

matrix(c(15366,2079,411,366,23223,2667,699,819,31632,2724,717,1473,49938,3111,1062,11964)
,nrow=4,ncol=4,byrow=T)
Run Code Online (Sandbox Code Playgroud)

所以单独使用这个子集我会期望第一行的行配置文件是:

0.002432689 0.0003291397 6.506803e-05 5.794379e-05
Run Code Online (Sandbox Code Playgroud)

并且第一列的列配置文件为:

0.0009473414, 0.0132572344, 0.0572742202, 0.0132863528 
Run Code Online (Sandbox Code Playgroud)

Jor*_*eys 1

您可以在这些类型的计算中使用它,甚至不需要一个循环。重写你的方程,然后你得到:

Xtrans [i,j] = X [i,j] / ( sum( X [i, ] ) * sqrt( sum( X [ ,j] ) ) )

要获得表示项的矩阵 - sum( X [i, ] ) * sqrt( sum( X [ ,j] ) ) - 您可以使用该函数outer()%o%如下所示:

rowSums(X) %o% sqrt(colSums(X))
Run Code Online (Sandbox Code Playgroud)

或者,对于列转换:

sqrt(rowSums(X)) %o% colSums(X)
Run Code Online (Sandbox Code Playgroud)

您需要做的唯一一件事是将原始矩阵除以这个矩阵,例如对于 col 变换:

TEST <- matrix(
               c(15366,2079,411,366,23223,2667,699,819,
                 31632,2724,717,1473,49938,3111,1062,11964),
                 nrow=4,ncol=4,byrow=T)

> TEST / (sqrt(rowSums(TEST)) %o% colSums(TEST))
             [,1]        [,2]        [,3]         [,4]
[1,] 0.0009473414 0.001455559 0.001053892 0.0001854284
[2,] 0.0011674098 0.001522501 0.001461474 0.0003383284
[3,] 0.0013770523 0.001346668 0.001298230 0.0005269580
[4,] 0.0016167998 0.001143812 0.001430074 0.0031831055
Run Code Online (Sandbox Code Playgroud)

您可以以大致相同的方式计算行转换。

进行手工计算,只要我正确理解您的索引符号(意味着 i 代表行,j 代表列),我就可以确认我的解决方案是正确的。您期望的数字并不是您所说的期望数字。给你看 :

> ( TEST[1,2] / sum(TEST[,2]) ) / sqrt(sum(TEST[1,]))
[1] 0.001455559
Run Code Online (Sandbox Code Playgroud)

你所说的卡方归一化,其实可以在包decostand的函数中找到vegan。请注意,默认情况下,该方法通过乘以矩阵总计的平方根进行调整。这在对应分析中是有意义的。

如果您不想使用此校正,那么您也可以获得例如列转换,如下所示:

> require(vegan)
> decostand(TEST,method="chi.square",MARGIN=2)/sqrt(sum(TEST))
             [,1]         [,2]        [,3]        [,4]
[1,] 0.0009473414 0.0011674098 0.001377052 0.001616800
[2,] 0.0014555588 0.0015225011 0.001346668 0.001143812
[3,] 0.0010538924 0.0014614736 0.001298230 0.001430074
[4,] 0.0001854284 0.0003383284 0.000526958 0.003183106
attr(,"decostand")
[1] "chi.square"
Run Code Online (Sandbox Code Playgroud)