Mis*_*opo 5 python missing-data pca statsmodels
我目前正在开发一个项目,我必须填写一些缺失的值。我使用Python,我看到有一种算法可以进行缺失数据插补。该算法称为 Nipals。因此,我决定寻找一种使用它的方法,我发现 statsmodels.multivariate.pca.PCA 可以帮助我。
我有一个名为 A 的 numpy 数组,其中包含 n 行和 p 列。A 有一些缺失值,即 NaN 值。我想用PCA来填充A。但是,没有例子可以帮助我做到这一点。
有人可以帮我用 Nipals 算法填充 A 吗?
谢谢。注意:抱歉,我是法语初学者,使用英文文档对我来说并不容易。
我找到了一种方法来填补缺失值。假设你有一个名为 A 的 numpy 数组
from statsmodels.multivariate.pca import PCA
pc = PCA(data=A,ncomp=1, missing='fill-em')
A=pc._adjusted_data
Run Code Online (Sandbox Code Playgroud)
享受 !您还可以使用另一种方法来填充缺失值:均值、中位数、k-邻居、mcmc(蒙特卡罗马尔可夫链)、最常见值...
| 归档时间: |
|
| 查看次数: |
1430 次 |
| 最近记录: |