R中的生态数据分组

Luk*_*uke 3 r bioinformatics

我正在研究一些生态数据(饮食)并试图找出如何按捕食者分组.我希望能够提取数据,以便我可以查看每个捕食者每个物种的每个猎物的重量,即计算出捕食者117吃掉的每个物种的平均重量.我放了一个样本我的数据如下.

   Predator PreySpecies PreyWeight
1   114      10    4.2035496
2   114      10    1.6307026
3   115       1   407.7279775
4   115       1   255.5430495
5   117      10    4.2503708
6   117      10    3.6268814
7   117      10    6.4342073
8   117      10    1.8590861
9   117      10    2.3181421
10  117      10    0.9749844
11  117      10    0.7424772
12  117      15    4.2803743
13  118       1   126.8559155
14  118       1   276.0256158
15  118       1   123.0529734
16  118       1   427.1129793
17  118       3   237.0437606
18  120       1   345.1957190
19  121       1   160.6688815
Run Code Online (Sandbox Code Playgroud)

flo*_*del 7

您可以使用以下aggregate功能:

aggregate(formula = PreyWeight ~ Predator + PreySpecies, data = diet, FUN = mean)

#   Predator PreySpecies PreyWeight
# 1      115           1 331.635514
# 2      118           1 238.261871
# 3      120           1 345.195719
# 4      121           1 160.668881
# 5      118           3 237.043761
# 6      114          10   2.917126
# 7      117          10   2.886593
# 8      117          15   4.280374
Run Code Online (Sandbox Code Playgroud)


csg*_*pie 5

有几种不同的方式来获得你想要的东西:

  1. aggregate功能.可能你追求的是什么.

    aggregate(PreyWeight ~ Predator + PreySpecies, data=dd, FUN=mean)
    
    Run Code Online (Sandbox Code Playgroud)
  2. tapply:非常有用,但只将变量除以一个因子,因此,我们需要使用paste命令创建一个need need因子:

    tapply(dd$PreyWeight, paste(dd$Predator, dd$PreySpecies), mean)
    
    Run Code Online (Sandbox Code Playgroud)
  3. ddply:部分plyr包装.很有用.值得学习.

    require(plyr)
    ddply(dd, .(Predator, PreySpecies), summarise, mean(PreyWeight))
    
    Run Code Online (Sandbox Code Playgroud)
  4. dcast:输出更多是表格格式.部分reshape2包装.

    require(reshape2)
    dcast(dd, PreyWeight ~ PreySpecies+ Predator, mean, fill=0)
    
    Run Code Online (Sandbox Code Playgroud)