Statsmodels Python 缺失值

Mis*_*opo 5 python missing-data pca statsmodels

我目前正在开发一个项目,我必须填写一些缺失的值。我使用Python,我看到有一种算法可以进行缺失数据插补。该算法称为 Nipals。因此,我决定寻找一种使用它的方法,我发现 statsmodels.multivariate.pca.PCA 可以帮助我。

我有一个名为 A 的 numpy 数组,其中包含 n 行和 p 列。A 有一些缺失值,即 NaN 值。我想用PCA来填充A。但是,没有例子可以帮助我做到这一点。

有人可以帮我用 Nipals 算法填充 A 吗?

谢谢。注意:抱歉,我是法语初学者,使用英文文档对我来说并不容易。

Mis*_*opo 4

我找到了一种方法来填补缺失值。假设你有一个名为 A 的 numpy 数组

from statsmodels.multivariate.pca import PCA
pc = PCA(data=A,ncomp=1, missing='fill-em')
A=pc._adjusted_data
Run Code Online (Sandbox Code Playgroud)

享受 !您还可以使用另一种方法来填充缺失值:均值、中位数、k-邻居、mcmc(蒙特卡罗马尔可夫链)、最常见值...