小编lin*_*bug的帖子

大熊猫与scipy之间的倾斜和峰度函数有什么区别？

我决定比较pandas和scipy.stats中的skew和kurtosis函数,并且不明白为什么我在库之间得到不同的结果.

据我在文档中可以看出,两个峰度函数都使用Fisher的定义来计算,而对于偏斜,似乎没有足够的描述来判断它们是如何计算的.

import pandas as pd
import scipy.stats.stats as st

heights = np.array([1.46, 1.79, 2.01, 1.75, 1.56, 1.69, 1.88, 1.76, 1.88, 1.78])

print "skewness:", st.skew(heights)
print "kurtosis:", st.kurtosis(heights)

Run Code Online (Sandbox Code Playgroud)

这会返回:

skewness: -0.393524456473
kurtosis: -0.330672097724

Run Code Online (Sandbox Code Playgroud)

而如果我转换为pandas数据帧:

heights_df = pd.DataFrame(heights)
print "skewness:", heights_df.skew()
print "kurtosis:", heights_df.kurtosis()

Run Code Online (Sandbox Code Playgroud)

这会返回:

skewness: 0   -0.466663
kurtosis: 0    0.379705

Run Code Online (Sandbox Code Playgroud)

如果我把它发布在错误的地方,我会道歉; 不确定这是统计数据还是编程问题.

python numpy scipy pandas

lin*_*bug

2015 10-14

17
推荐指数

1
解决办法

8282
查看次数

标签统计

numpy ×1

pandas ×1

python ×1

scipy ×1

大熊猫与scipy之间的倾斜和峰度函数有什么区别？

标签 统计

小编lin_bug的帖子

标签统计