可能重复:
使用R识别或编码唯一因子
我和R有点麻烦
我有一个类似于以下的数据集,但更长.
A B Pulse
1 2 23
2 2 24
2 2 12
2 3 25
1 1 65
1 3 45
Run Code Online (Sandbox Code Playgroud)
基本上,前两列是编码的.A
有1,2表示2个不同的权重.
B
有1,2,3代表3个不同的时间.
由于它们是编码数值,因此R将它们视为数值变量.我需要使用因子函数将这些变量转换为因子.
救命?
我试图使用lars包进行套索回归,但似乎无法使lars位工作.我输入了代码:
diabetes<-read.table("diabetes.txt", header=TRUE)
diabetes
library(lars)
diabetes.lasso = lars(diabetes$x, diabetes$y, type = "lasso")
Run Code Online (Sandbox Code Playgroud)
但是,我收到一条错误消息:rep(1,n)中的错误:无效的'times'参数.
我试过这样输入:
diabetes<-read.table("diabetes.txt", header=TRUE)
library(lars)
data(diabetes)
diabetes.lasso = lars(age+sex+bmi+map+td+ldl+hdl+tch+ltg+glu, y, type = "lasso")
Run Code Online (Sandbox Code Playgroud)
但后来我收到错误消息:'lars中的错误(年龄+性别+ bmi +地图+ td + ldl + hdl + tch + ltg + glu,y,type ="lasso"):找不到对象'age'
我哪里错了?
编辑:数据 - 如下所示,但另外5列.
ldl hdl tch ltg glu
1 -0.034820763 -0.043400846 -0.002592262 0.019908421 -0.017646125
2 -0.019163340 0.074411564 -0.039493383 -0.068329744 -0.092204050
3 -0.034194466 -0.032355932 -0.002592262 0.002863771 -0.025930339
4 0.024990593 -0.036037570 0.034308859 0.022692023 -0.009361911
5 0.015596140 0.008142084 -0.002592262 -0.031991445 -0.046640874
Run Code Online (Sandbox Code Playgroud)