我的数据有3个独立变量,所有变量都是分类的:
condition: cond1, cond2, cond3
population: A,B,C
task: 1,2,3,4,5
Run Code Online (Sandbox Code Playgroud)
因变量是任务完成时间.我lm(time~condition+user+task,data)在R中运行并得到以下结果:

令我困惑的是,cond1,groupA和task1被排除在结果之外.从线性回归"NA"仅估计最后一个系数,我理解选择一个因子水平作为"基线"并显示在(拦截)行中.
但是,如果有多个因子水平用作基线,如上所述呢?
我正在尝试使用lm和glm函数在R中进行回归.
我的因变量是基于在给定时间段内非事件的事件比例的logit变换数据.所以我的因变量是连续的,而我的自变量是因子变量或虚拟变量.
我有两个可以取值的自变量
- 年份i到年份m,我的YEAR变量
- 月j到月n,我的MONTH变量
问题是每当我运行我的模型作为摘要时,结果4月(月份指数1)和1998年(年份指数1)不在结果范围内......如果我改变4月份让我们说"foo_bar",8月将是失踪...
请帮忙!这令我感到沮丧,我根本不知道如何寻找问题的解决方案.