为什么 np.std(X) 和 X.std() 返回不同的值?

Mat*_*att 2 statistics numpy standard-deviation pandas

我正在尝试使用均值归一化计算数据集的归一化分数。当我写作时(X - np.mean(X))/np.std(X),它给我的分数与实际的分数不同((X - X.mean())/X.std()

问题似乎来自标准差的计算。X.std()返回一个标准差值并np.std()返回不同的标准化值。为什么会发生这种情况?

小智 5

Pandas 使用无偏估计量(分母中的 N-1),而 Numpy 默认情况下不使用。

要使它们表现相同,请传递ddof=1numpy.std().

pandas 与 numpy 的不同标准

  • 如果它解决了问题并且您对此答案感到满意,请@Matt,接受它并关闭问题。 (2认同)