小编Ale*_*lex的帖子

在带有分类变量的R中使用LASSO

我有一个包含1000个观测值和76个变量的数据集,其中约有20个是分类的。我想在整个数据集上使用LASSO。我知道通过lars或glmnet在LASSO中使用因子变量并不能真正起作用,但是变量太多了,它们可以采用太多不同的无序值来对它们进行合理的数字编码。

在这种情况下可以使用LASSO吗?我该怎么做呢?创建预测变量矩阵可产生以下响应:

hdy<-as.numeric(housingData2[,75])
hdx<-as.matrix(housingData2[,-75])
model.lasso <- lars(hdx, hdy)
Error in one %*% x : requires numeric/complex matrix/vector arguments
Run Code Online (Sandbox Code Playgroud)

我认识到其他方法可能更容易或更合适,但是实际的挑战是使用Lars或glmnet来做到这一点,因此,如果可能的话,我将不胜感激任何想法或反馈。

谢谢,

regression r lasso-regression glmnet lars

7
推荐指数
2
解决办法
8909
查看次数

标签 统计

glmnet ×1

lars ×1

lasso-regression ×1

r ×1

regression ×1