我在一个广义线性模型上运行一个弹性网,其中的glmnet和插入包在R中.
我的响应变量是cost(其中cost> $ 0),因此我想为我的GLM指定一个带有日志链接的Gaussian系列.但是glmnet似乎不允许我指定 (link="log")如下:
> lasso_fit <- glmnet(x, y, alpha=1, family="gaussian"(link="log"), lambda.min.ratio=.001)
Run Code Online (Sandbox Code Playgroud)
我尝试了不同的变种,有没有引用,但没有运气.glmnet文档没有讨论如何包含日志链接.
我错过了什么吗?是否family="gaussian"已隐式假设日志链接?
我有点困惑插入符号如何在 k 折交叉验证中对测试折叠进行评分。
我想生成一个数据框或矩阵,其中包含 10 折交叉验证中十个测试数据集的评分记录。
例如,使用 iris 数据集训练决策树模型:
install.packages("caret", dependencies=TRUE)
library(caret)
data(iris)
train_control <- trainControl(method="cv", number=10, savePredictions = TRUE),
model <- train(Species ~ ., data=iris, trControl=train_control, method="rpart")
model$pred
Run Code Online (Sandbox Code Playgroud)
该model$pred命令列出了 450 条记录中十倍的预测。
这似乎不对 - 不应该对十个测试折叠中model$pred的150 条记录产生预测(1/10 * 150 = 每个测试折叠 15 条记录)?450条记录是如何产生的?
我刚刚开始使用Python v3.5.2。我已经通过Anaconda安装了IPython,现在正在尝试运行一个简单的程序。
我print("Hello World!")在文本编辑器中编写了一个简单的脚本,并将其保存为“ C:\ Python code \ python_practice_code.py”。
我尝试了各种方法来执行python_practice_code.py(带引号和不带引号),但出现两个错误之一:
In [34]: %run C:\Python code\python_practice_code.py
ERROR: File `'C:\Python/py'` not found.
Run Code Online (Sandbox Code Playgroud)
要么
In [35]: ipython 'C:\Python code\python_practice_code.py'
File "<ipython-input-35-30b39bc825d7>", line 1
ipython 'C:\Python code\python_practice_code.py'
SyntaxError: invalid syntax
Run Code Online (Sandbox Code Playgroud)
我究竟做错了什么?
我已经通过连续变量的值按降序对分析数据集进行了排序,并且希望为前200行中的记录创建指示符变量y = 1,否则为y = 0.
我第一次遇到这个问题:
train1 <- train1[order(-train1$ALWAMT_FOLLOWING),]
train1$y <- ifelse(train1[1:200,], 1, 0)
Run Code Online (Sandbox Code Playgroud)
返回错误:
Error in ifelse(train1[1:200, ], 1, 0) :
(list) object cannot be coerced to type 'logical'
Run Code Online (Sandbox Code Playgroud)
任何帮助深表感谢!