我对R还是很陌生,需要一些帮助来完成我想要的分析(我在GraphPad Prism中一直在进行的分析,但这不能处理大型数据集)。我有一个这样的数据框(简化):
Gene Seq RBP Sites.length
1 Short A 0.26
1 Short B 0.13
1 Short C 0.65
1 Long A 0.00
1 Long B 0.39
1 Long C 1.82
2 Short A 0.13
2 Short B 0.00
2 Short C 0.00
2 Long A 0.89
...etc...
Run Code Online (Sandbox Code Playgroud)
我想知道每个RBP的“短”序列和“长”序列的平均“ Sites.length”值之间是否存在显着差异。我已经执行了方差分析和TukeyHSD:
> aov_migr <- aov (Sites.length ~ Seq * RBP, data = my_data)
> migr_hsd <- TukeyHSD (aov_migr)
Run Code Online (Sandbox Code Playgroud)
结果如下:
> summary(aov_migr)
Df Sum Sq Mean Sq F value Pr(>F)
Seq 1 0.03 …Run Code Online (Sandbox Code Playgroud)