小鼠的完整功能到底是做什么的?

Rya*_*Kao 5 statistics r r-mice imputation

我正在研究如何使用多重插补结果。以下是我的理解,如有错误请指出。

假设您有一个包含缺失值的数据集,并且您想要进行回归分析。您可以对 m = 5 次执行多重插补,并且对于每个插补数据集(现在有 5 个插补数据集)运行回归分析,然后通过 Rubin 规则(或使用 R)“汇集”这些 m = 5 模型的系数估计值包“池”)。

我的问题是,在小鼠中你有一个函数complete(),并且手册说你可以使用 提取完整的数据集complete(object)

但是如果我使用 mouse m = 5 次,那么使用是否仍然有意义complete()complete()我会得到哪些插补结果?

另外,如果我只使用 m = 1 的小鼠,这有意义吗?谢谢。

jay*_*.sf 9

您可能忽略了mice::complete()在参数中使用action=1默认值,它“返回第一个估算数据集”(请参阅​​ 参考资料?mice::complete),实际上是毫无价值的

您绝对应该考虑action="long"多重插补的“多重性”!

,使用它根本没有意义m=1(除了调试),因为每个插补都是基于随机过程,并且您必须汇集结果(使用任何方法)来解释变化。经常m>20推荐1

基本上,多重插补的工作原理如下:

  1. 使用随机分量创建m 个插补过程,以获得
  2. m略有不同的估算数据集。
  3. 分析每个估算数据集以获得略有不同的参数估计值。
  4. 合并结果,计算参数估计的变化。

(另请参阅多重插补简明扼要的概述。)


Noa*_*oah 0

当您使用 时mice,您得到的对象不是估算数据集。如果不使用 中的特殊功能,则无法直接对其进行操作mice。如果要提取实际的插补数据集,请使用complete,其输出是一个 data.frame,每个插补每个人一行(如果使用该"long"格式)。如果您正在对无法在 中执行的估算数据进行任何分析mice,则需要首先创建此数据集。