小编pab*_*ade的帖子

pandas DataFrame 中的 Z 分数标准化 (python)

我正在使用 python3 (spyder)，并且我有一个对象类型为“pandas.core.frame.DataFrame”的表。我想对该表中的值进行 z 分数标准化（每个值减去其行的平均值并除以其行的 sd），因此每行的平均值 = 0 和 sd = 1。我尝试了两种方法。

\n\n

第一种方法

\n\n

from scipy.stats import zscore\nzetascore_table=zscore(table,axis=1)\n

Run Code Online (Sandbox Code Playgroud)\n\n

第二种方法

\n\n

rows=table.index.values\ncolumns=table.columns\nimport numpy as np\nfor i in range(len(rows)):\n    for j in range(len(columns)):\n         table.loc[rows[i],columns[j]]=(table.loc[rows[i],columns[j]] - np.mean(table.loc[rows[i],]))/np.std(table.loc[rows[i],])\ntable\n

Run Code Online (Sandbox Code Playgroud)\n\n

两种方法似乎都有效，但是当我检查每行的平均值和标准差时，它不是想象中的 0 和 1，而是其他浮点值。我不知道\xc2\xb4t 可能是哪个问题。

\n\n

在此先感谢您的帮助！

normalization python-3.x pandas spyder

pab*_*ade

lucky-day

7
推荐指数

1
解决办法

3万
查看次数