变量选择方法

Bar*_*aby 2 r

我一直在为建模问题做变量选择.

我使用了试验和错误来选择(添加/删除变量),减少了错误.然而,我遇到了挑战,因为变量的数量增加到数百个,手动变量选择无法执行,因为模型需要花费1/2小时来计算,从而无法完成任务.

您是否碰巧知道除跳跃包中的regsubsets之外的任何其他包(当使用相同的试验和错误变量进行测试时产生更高的错误,它不包括一些线性依赖的变量 - 排除一些有价值的变量).

Rei*_*son 6

您需要更好(即没有缺陷)的模型选择方法.有很多选择,但应该很容易适应你的情况将是使用某种形式的正规化,如套索或弹性网.这些应用缩小到系数的大小; 如果系数从其最小二乘解收缩为零,则从模型中移除该变量.得到的模型系数略有偏差,但它们的方差低于选定的OLS项.

看看lars,glmnet惩罚