小编cou*_*ete的帖子

如何在glmnet和交叉验证中自动化变量选择

我正在学习glmnetbrnn包的使用.请考虑以下代码:

library(RODBC)
library(brnn)
library(glmnet)
memory.limit(size = 4000)
z <-odbcConnect("mydb") # database with Access queries and tables

# import the data
f5 <- sqlFetch(z,"my_qry")

# head(f5)

# check for 'NA'
sum(is.na(f5))

# choose a 'locn', up to 16 of variable 'locn' are present
f6 <- subset(f5, locn == "mm")
# dim(f6)

# use glmnet to identify possible iv's

training_xnm <- f6[,1:52] # training data
xnm <- as.matrix(training_xnm)
y <- f6[,54] # response

fit.nm <- glmnet(xnm,y, family="binomial", alpha=0.6, …
Run Code Online (Sandbox Code Playgroud)

r glmnet

5
推荐指数
1
解决办法
7306
查看次数

使用R统计信息为每一行添加一个组和

我有数据框,df如:

key  entry  x1
1    1      0.2
1    2      0.1
1    3      0.5
1    4      0.6
2    1      0.2
2    2      0.1
2    3      0.7
2    4      0.3
Run Code Online (Sandbox Code Playgroud)

每个组由值定义key并具有相同数量的entry值.我想保留这个表结构供以后使用.我需要添加一个新列,sumx1以便每行具有x1与该行关联的键组的总和.

在上面的例子中,密钥组1的总和将是0.2 + 0.1 + 0.5 + 0.6 = 1.4,因此在名为sumx1I 的新列中,对于密钥为1的每一行,需要输入1.4.

我试过了:

df["sumx1"] <- NA
df$sumx1 <- aggregate(df$sumx1, list(key=df$key), sum)
Run Code Online (Sandbox Code Playgroud)

但这会引发警告错误,因为它只给我每组的总和.

r

2
推荐指数
1
解决办法
1157
查看次数

标签 统计

r ×2

glmnet ×1