如何仅用鼠标 R 估算一列或某些列

Mad*_*Man 2 r dataframe r-mice imputation

我正在用 R 中的 mouse 包进行试验,并且很好奇如何将列排除在插补之外。

  1. 如果我只想对一列进行平均插补,则该 mice.impute.mean(y, ry, x = NULL, ...)函数似乎就是我要使用的。我正在努力理解我需要包含什么作为第三个参数才能使其工作。
  2. 如果我有一个包含姓名、ID、出生日期等分类数据的数据集,这些数据不应该影响其他列的计算,并且在缺失时不应填写,我如何告诉小鼠在其中排除这些列计算?

我一直在使用小鼠数据集 nhanes进行探索。

谢谢

sta*_*007 5

我不知道你的数据,因此我不能为你创建一个例子,但你正在寻找 mouse ()函数的这个参数

predictorMatrix
一个长度(块)行和 ncol(数据)列的数字矩阵,包含 0/1 数据,指定要用于每个目标列的预测变量集。每行对应一个变量块,即要插补的一组变量。值为 1 表示列变量用作目标块(在行中)的预测变量。默认情况下,predictorMatrix 是 ncol(data) 行和列的方阵,除对角线外,全为 1。注意:对于两级插补模型(名称中有“2l”),也允许使用其他代码(例如,2 或 -2)。

使用此参数,您可以定义要使用哪些列来估算特定列。

其中
具有与数据相同维度的逻辑的数据框或矩阵,指示应在数据中的何处创建插补。默认值,其中 = is.na(data),指定应估算缺失的数据。where 参数可用于过度插补观察到的数据,或跳过所选缺失值的插补。

您可以在此处定义要为哪些列创建插补。