Sor*_*art 1 python pandas statsmodels
我想找到两种平均值(男性与女性)之间差异的置信区间。我浏览了 statsmodels 的索引,发现了下面的函数。但是它没有解释我应该在哪里指定男性和女性系列。请指教。
功能:
CompareMeans.tconfint_diff(alpha=0.05, alternative='two-sided', usevar='pooled')
Run Code Online (Sandbox Code Playgroud)
两个系列的描述性统计应该以格式传递给CompareMeans班级DescrStatsW。之后,您可以使用tconfint_diff该类的方法CompareMeans来获取均值差异的置信区间。
import pandas as pd
import numpy as np
from statsmodels.stats.weightstats import DescrStatsW, CompareMeans
df = pd.DataFrame({
'Male': np.random.normal(loc=50, scale=5, size=100),
'Female': np.random.normal(loc=50, scale=25, size=100),
})
cm = CompareMeans(d1=DescrStatsW(data=df['Male']), d2=DescrStatsW(data=df['Female']))
lower, upper = cm.tconfint_diff(alpha=0.05, alternative='two-sided', usevar='unequal')
Run Code Online (Sandbox Code Playgroud)