Xau*_*ume 3 r environment-variables non-standard-evaluation
有一个lm对象,我需要根据其表示为字符向量的变量创建一个函数。我尝试结合使用eval和expr创建一个f功能,该功能将进一步用于后者obj并对其进行nlm优化。
library(tidyverse)
df <- drop_na(airquality)
model <- lm(Ozone~. - Temp, data = df, x=TRUE, y=TRUE)
base_vars <- all.vars(formula(model)[-2])
k <- length(base_vars)
f <- function(base_df, x, y, parms) {
with(base_df, parms[1] +
eval(expr(paste(paste(paste0('parms[', 2:(k+1), ']'), base_vars, sep = '*'), collapse = '+'))) +
log(parms[k+2] * (x - parms[k+3] ^ 2)))
}
obj <- function(parms, y, x) mean((residuals(model) - f(df, x, y, parms))^2)
fit <- with(data, nlm(obj, c(0, 0, 0, 0, 0, 0, 0), y = e, x = x))
Run Code Online (Sandbox Code Playgroud)
但是调用会f(model$x, df$Temp, model$y, c(0, 0, 0, 0, 0, 0, 0))导致以下错误:
Error in eval(substitute(expr), data, enclos = parent.frame()) :
numeric 'envir' arg not of length one
4.
eval(substitute(expr), data, enclos = parent.frame())
3.
with.default(base_df, parms[1] + eval(expr(paste(paste(paste0("parms[",
2:(k + 1), "]"), base_vars, sep = "*"), collapse = "+"))) +
log(parms[k + 2] * (x - parms[k + 3]^2)))
2.
with(base_df, parms[1] + eval(expr(paste(paste(paste0("parms[",
2:(k + 1), "]"), base_vars, sep = "*"), collapse = "+"))) +
log(parms[k + 2] * (x - parms[k + 3]^2)))
1.
f(model$x, df$Temp, model$y, c(0, 0, 0, 0, 0, 0, 0))
Run Code Online (Sandbox Code Playgroud)
我相信eval环境和with功能隐含的环境之间可能存在冲突,但无法弄清楚原因。任何想法如何f为变量模型创建自定义函数?
的预期输出f(model$x, df$Temp, model$y, c(0, 0, 0, 0, 0, 0, 0))将是:
with(base_df, parms[1]+parms[2]*Solar.R+parms[3]*Wind+parms[4]*Temp+parms[5]*Month+
parms[6]*Day+log(parms[7] * (Temp - parms[8] ^ 2)))
Run Code Online (Sandbox Code Playgroud)
但对于不同的模型,它可能是这样的:
with(base_df,
parms[1]+parms[2]*var1+parms[3]*var2+log(parms[4]*(var3-parms[5]^2)))
Run Code Online (Sandbox Code Playgroud)
所以每次调用的变量和参数的数量都不同。
R 支持在语言上进行计算,但它不应该是您的首选。如果你这样做,它不应该涉及代码的文本处理。这里没有需要计算语言的情况。我不知道你认为你的尝试会如何工作,但我不知道这个expr功能,我拒绝安装包 tidyverse 及其巨大的依赖树。
此外,您通常应该避免with在交互式使用之外。但with不是这里的问题。
这是我将如何做到这一点:
df <- airquality[complete.cases(airquality),]
model <- lm(Ozone~. - Temp, data = df)
f <- function(base_df, x, parms) {
m <- model.matrix(model, data = base_df)
k <- ncol(m)
stopifnot(length(parms) == (k + 2L))
#I use exp(parms[k+1]) to ensure a positive value within the log
m %*% parms[seq_len(k)] + log(exp(parms[k + 1L]) * (x - parms[k + 2L] ^ 2))
}
obj <- function(parms, y, x, base_df) mean((residuals(model) - f(base_df, x, parms))^2)
#some x:
x <- rpois(nrow(df), 10)
fit <- nlm(obj, c(0, 0, 0, 0, 0, 0, 0), x = x, base_df = df)
#works
Run Code Online (Sandbox Code Playgroud)
你似乎没有使用y,因此我从代码中删除了它。
请注意我如何为线性部分创建设计矩阵(使用model.matrix)并使用矩阵乘法与参数。你还需要确保log不会返回Inf/ -Inf/ NaN。