Bonferroni校正超几何分析的p值

Glo*_*oom 1 python statistics analysis error-correction false-positive

我已经进行了超几何分析(使用python脚本)来研究基因子集中GO术语的富集.我输出的一个例子如下:

GO00001 1500    300 200 150 5.39198144708e-77
GO00002 1500    500 400 350 1.18917839281e-160
GO00003 1500    400 350 320 9.48402847878e-209
GO00004 1500    100 100 75  3.82935778527e-82
GO00005 1500    100 80  80  2.67977253966e-114
Run Code Online (Sandbox Code Playgroud)

哪里

Column1 = GO ID
Column2 = Total sum of all terms in the original dataset
Column3 = Total sum of [Column 1] IDs in the original dataset
Column4 = Sum of all terms in the subset
Column5 = Sum of [Column 1] IDs in subset
Column6 = pvalue derived from hypergeometric test
Run Code Online (Sandbox Code Playgroud)

我知道我必须将实验数乘以pvalue,但我不知道如何用我拥有的数据做到这一点.我是从子集或原始数据集和子集的组合计算的?例如,它会是:

Column2 * Column5 * pvalue
Column3 * Column5 * pvalue
Column4 * Column5 * pvalue
Run Code Online (Sandbox Code Playgroud)

如果这看起来像一个愚蠢的问题我很抱歉,但我似乎无法理解它.提前谢谢了!

Phl*_*lya 6

from statsmodels.sandbox.stats.multicomp import multipletests
p_adjusted = multipletests(Column6, method='bonferroni')
Run Code Online (Sandbox Code Playgroud)

或者我错过了什么?..