Mat*_*att 2 statistics numpy standard-deviation pandas
我正在尝试使用均值归一化计算数据集的归一化分数。当我写作时(X - np.mean(X))/np.std(X),它给我的分数与实际的分数不同((X - X.mean())/X.std()。
问题似乎来自标准差的计算。X.std()返回一个标准差值并np.std()返回不同的标准化值。为什么会发生这种情况?
小智 5
Pandas 使用无偏估计量(分母中的 N-1),而 Numpy 默认情况下不使用。
要使它们表现相同,请传递
ddof=1到numpy.std().
| 归档时间: |
|
| 查看次数: |
1071 次 |
| 最近记录: |