Bar*_*aby 2 r
我一直在为建模问题做变量选择.
我使用了试验和错误来选择(添加/删除变量),减少了错误.然而,我遇到了挑战,因为变量的数量增加到数百个,手动变量选择无法执行,因为模型需要花费1/2小时来计算,从而无法完成任务.
您是否碰巧知道除跳跃包中的regsubsets之外的任何其他包(当使用相同的试验和错误变量进行测试时产生更高的错误,它不包括一些线性依赖的变量 - 排除一些有价值的变量).
Rei*_*son 6
您需要更好(即没有缺陷)的模型选择方法.有很多选择,但应该很容易适应你的情况将是使用某种形式的正规化,如套索或弹性网.这些应用缩小到系数的大小; 如果系数从其最小二乘解收缩为零,则从模型中移除该变量.得到的模型系数略有偏差,但它们的方差低于选定的OLS项.
看看lars,glmnet和惩罚包
归档时间:
12 年 前
查看次数:
5923 次
最近记录:
11 年,9 月 前