小编Ell*_*ott的帖子

R:保留某些变量的回归

我正在使用 lm() 做一个多线性回归模型,Y 是响应变量(例如:利息回报),其他是解释变量(100 多个案例,30 多个变量)。

有某些变量被视为关键变量(与投资有关),当我运行 lm() 函数时,R 返回一个 adj.r.square 为 97% 的模型。但一些关键变量并不是重要的预测因素。

有没有办法通过保留模型中的所有关键变量(作为重要预测变量)来进行回归?调整后的R平方是否减小也没关系。

如果回归不起作用,还有其他方法吗?

谢谢你!

=========================

数据集上传 https://www.dropbox.com/s/gh61obgn2jr043y/df.csv

=========================

附加问题:如果某些变量对前期和本期有影响怎么办?示例:一个人在早上吃早餐时服用一颗药丸,药丸的效果可能会在午餐后持续(并且他/她在午餐时服用第二颗药丸)我想我需要考虑数据转换。* 我的第一选择是加上结转率:obs.2_trans = obs.2 + corate * obs.1 * 也许我还需要考虑药丸效应本身的衰减,所以是s曲线指数变换也是必要的。

以变​​量 main1 为例,我可以使用 try-out 方法来获得理想的协同率和 s 曲线参数,从 0.5 开始,以 0.05 为步长进行测试,向上到 1 或向下到 0,直到获得最高的模型分数 -例如,最低的 AIC 或最高的 R 平方。这已经是一个巨大的测试量了。如果我需要同时测试 3 个以上的变量,我该如何通过 R 进行管理?

谢谢你!

regression r

4
推荐指数
1
解决办法
1985
查看次数

标签 统计

r ×1

regression ×1