Rya*_*Kao 5 statistics r r-mice imputation
我正在研究如何使用多重插补结果。以下是我的理解,如有错误请指出。
假设您有一个包含缺失值的数据集,并且您想要进行回归分析。您可以对 m = 5 次执行多重插补,并且对于每个插补数据集(现在有 5 个插补数据集)运行回归分析,然后通过 Rubin 规则(或使用 R)“汇集”这些 m = 5 模型的系数估计值包“池”)。
我的问题是,在小鼠中你有一个函数complete()
,并且手册说你可以使用 提取完整的数据集complete(object)
。
但是如果我使用 mouse m = 5 次,那么使用是否仍然有意义complete()
?complete()
我会得到哪些插补结果?
另外,如果我只使用 m = 1 的小鼠,这有意义吗?谢谢。
您可能忽略了mice::complete()
在参数中使用action=1
默认值,它“返回第一个估算数据集”(请参阅 参考资料?mice::complete
),实际上是毫无价值的。
您绝对应该考虑action="long"
多重插补的“多重性”!
不,使用它根本没有意义m=1
(除了调试),因为每个插补都是基于随机过程,并且您必须汇集结果(使用任何方法)来解释变化。经常m>20
推荐1.
基本上,多重插补的工作原理如下:
(另请参阅多重插补简明扼要的概述。)
当您使用 时mice
,您得到的对象不是估算数据集。如果不使用 中的特殊功能,则无法直接对其进行操作mice
。如果要提取实际的插补数据集,请使用complete
,其输出是一个 data.frame,每个插补每个人一行(如果使用该"long"
格式)。如果您正在对无法在 中执行的估算数据进行任何分析mice
,则需要首先创建此数据集。