在R中选择哪个级别是lm回归中的因子的基本类别的最佳方式

Question

在R中选择哪个级别是lm回归中的因子的基本类别的最佳方式

假设我想使用lm和factor作为右侧变量运行回归.选择因子中哪个级别为基本类别(排除以避免多重共线性的级别)的最佳方法是什么.请注意,我对排除拦截不感兴趣,因为我有很多因素.

我还想要一个基于公式的解决方案,而不是直接作用于data.frame的解决方案,尽管如果你认为你有一个非常好的解决方案,请发布它.

我的解决方案是:

base_cat <- function(x) c(x,1:(x-1),(x+1):100) 
a_reg <- lm(y ~ x1 + x2 + factor(x3, levels=base_cat(30)) #suppose that x3 has draws from the integers 1 to 100.

Run Code Online (Sandbox Code Playgroud)

左边的类别lm是因子中的第一个级别,因此这只是重新排序级别,以便指定的级别是第一个级别base_cat(),然后将其余级别放在后面.

还有其他想法吗？

Answer 1

jor*_*ran 6

该功能relevel正是如此.您将无序因子和参考级别的名称传递给它,并返回该级别作为第一个级别的因子.

归档时间：	14 年，3 月前
查看次数：	1770 次
最近记录：	7 年，5 月前