小编use*_*234的帖子

R:用ddply分组测试

我试图计算每个因子级别的数据框中两个数字列之间的相关性.这是一个示例数据框:

concentration <-(c(3, 8, 4, 7, 3, 1, 3, 3, 8, 6))
area <-c(0.5, 0.9, 0.3, 0.4, 0.5, 0.8, 0.9, 0.2, 0.7, 0.7)
area_type <-c("A", "B", "A", "B", "A", "B", "A", "B", "A", "B")
data_frame <-data.frame(concentration, area, area_type)
Run Code Online (Sandbox Code Playgroud)

在这个例子中,我想计算每个level_type级别的浓度和面积之间的相关性.我想使用cor.test而不是cor,因为我想要p值和kendall tau值.我试过用ddply做到这一点:

ddply(data_frame, "area_type", summarise,
  corr=(cor.test(data_frame$area, data_frame$concentration,
                 alternative="two.sided", method="kendall") ) )
Run Code Online (Sandbox Code Playgroud)

但是,我遇到输出问题:它的组织方式与正常的Kendall cor.test输出不同,后者表示z值,p值,备选假设和tau估计.而不是那样,我得到下面的输出.我不知道输出的每一行表示什么.此外,每个level_type级别的输出值都相同.

  area_type                                         corr
1          A                                    0.3766218
2          A                                         NULL
3          A                                    0.7064547
4          A                                    0.1001252
5          A                                            0
6          A                                    two.sided
7          A               Kendall's rank correlation tau
8          A data_frame$area …
Run Code Online (Sandbox Code Playgroud)

r plyr

1
推荐指数
1
解决办法
3173
查看次数

标签 统计

plyr ×1

r ×1