是否有一种简单的方法可以在R模型中包含所有可能的双向交互?
鉴于此模型:
lm(a~b+c+d)
Run Code Online (Sandbox Code Playgroud)
将使用什么语法使模型包括b,c,d,bc,bd和cd作为解释变量,bc是主效应b和c的交互项.
我在 R 中有一个线性模型,其中包含所有可能的双向交互。模型中包含的变量之一是 JobAfter18:
> levels(AcademicData$JobAfter18)
[1] "No" "Yes, one job" "Yes, two jobs" "Yes, more than two jobs"
Run Code Online (Sandbox Code Playgroud)
在此处查看时,该变量具有这 4 个因子水平。然而,在拟合摘要中,结果如下:
AcademicData$JobAfter18.L 34.042724 33.857406 1.005 0.31725
AcademicData$JobAfter18.Q -43.296277 20.763852 -2.085 0.03976 *
AcademicData$JobAfter18.C -14.816135 8.309894 -1.783 0.07782 .
Run Code Online (Sandbox Code Playgroud)
L、Q 和 C 来自哪里,它们的含义是什么?我意识到因子变量将在输出中包含 n-1 个因子级别,因为未包含的因子级别是与其他因子级别进行比较的基线。我只是不明白为什么级别会出现这些字母而不是写出来,因为它们是其他变量的,例如这里看到的“性别”因子变量,它具有“男性”和“女性”级别:
AcademicData$SexMale 19.421651 12.331565 1.575 0.11863
Run Code Online (Sandbox Code Playgroud) r ×2