Sau*_*rma 8 statistics missing-data python-3.x hypothesis-test imputation
我如何执行 Little's Test,以在 Python 中找到 MCAR?我已经查看了 R 包进行相同的测试,但我想在 Python 中进行。是否有其他方法来测试 MCAR?
您可以使用 rpy2 从 R 获取 mcar 测试。请注意,使用 rpy2 需要一些 R 编码。
在 Google Colab 中设置 rpy2
# rpy2 libraries
import rpy2.robjects as robjects
from rpy2.robjects.packages import importr
from rpy2.robjects import pandas2ri
from rpy2.robjects import globalenv
# Import R's base package
base = importr("base")
# Import R's utility packages
utils = importr("utils")
# Select mirror 
utils.chooseCRANmirror(ind=1)
# For automatic translation of Pandas objects to R
pandas2ri.activate()
# Enable R magic
%load_ext rpy2.ipython
# Make your Pandas dataframe accessible to R
globalenv["r_df"] = df
现在,您可以使用 R 魔法在 Python 环境中获取 R 功能。用于%R单行 R 代码以及%%R整个单元格应解释为 R 代码时。
要安装 R 包,请使用:
utils.install_packages("package_name")
您可能还需要先加载它才能使用:
%R library(package_name)
对于 Little 的 MCAR 测试,我们应该安装该naniar软件包。它的安装稍微复杂一些,因为我们还需要安装remotes才能从 github 下载它,但对于其他包,一般过程应该足够了。
utils.install_packages("remotes")
%R remotes::install_github("njtierney/naniar")
加载naniar包:
%R library(naniar)
将您的传递r_df给mcar_test函数:
# mcar_test on whole df
%R mcar_test(r_df)
如果发生错误,请尝试仅包含缺少数据的列:
%%R
# mcar_test on columns with missing data
r_dfMissing <- r_df[c("col1", "col2", "col3")]
mcar_test(r_dfMissing)
| 归档时间: | 
 | 
| 查看次数: | 3602 次 | 
| 最近记录: |