标准偏差为零的归一化

Jus*_*VSI 3 python statistics numpy data-science

我正在尝试使用以下代码在python中居中和规范化数据集

mean = np.mean(train, axis=0)
std = np.std(train, axis=0)
norm_train = (train - mean) / std
Run Code Online (Sandbox Code Playgroud)

问题是我通过零错误得到了一个devision.数据集中的两个值最终具有零标准.数据集的形状(3750,55).我的统计技能不是很强,所以我不知道如何克服这一点.有什么建议?

ayh*_*han 6

由于标准偏差是通过取平均值的平方偏差之和来计算的,因此只有当变量的所有值相同(均等于平均值​​)时才能实现零标准偏差.在这种情况下,这些变量没有判别力,因此可以从分析中删除它们.他们无法改进任何分类,聚类或回归任务.许多实现将为您执行此操作或抛出有关矩阵计算的错误.