在 R 中是否有超过 3 个参数预测变量或类似效果的技巧的 loess 实现？

Question

在 R 中是否有超过 3 个参数预测变量或类似效果的技巧的 loess 实现？

kre*_*eil 3 regression global r local loess

召集所有关于本地回归和/或R 的专家！

我遇到了R 中标准loess函数的限制，希望您能提供一些建议。当前实现仅支持 1-4 个预测器。让我列出我们的应用场景，以说明为什么一旦我们想要使用全局拟合参数协变量，这很容易成为一个问题。

本质上，我们有一个空间失真s(x,y)叠加在多个测量值z 上：

z_i = s(x_i,y_i) + v_{g_i}
Run Code Online (Sandbox Code Playgroud)
这些测量值z可以按每个组g的相同基础未失真测量值v分组。每次测量的组成员资格 g_i 都是已知的，但组的潜在未失真测量值 v_g 未知，应由（全局，而非局部）回归确定。

我们需要估计二维空间趋势s(x,y)，然后我们想要删除它。在我们的应用程序中，假设在最简单的情况下有 20 组，每组至少有 35 个测量值。测量值是随机放置的。以第一组为参考，因此有 19 个未知偏移量。

下面的玩具数据代码（在一维x 中具有空间趋势）适用于两个或三个偏移组。

不幸的是，四个或更多偏移组的loess调用失败并显示错误消息

Error in simpleLoess(y, x, w, span, degree, parametric, drop.square, normalize, : only 1-4 predictors are allowed"
Run Code Online (Sandbox Code Playgroud)
我尝试覆盖限制并得到

k>d2MAX in ehg136. Need to recompile with increased dimensions.
Run Code Online (Sandbox Code Playgroud)
做起来有多容易？我在任何地方都找不到d2MAX的定义，似乎这可能是硬编码的——该错误显然是由loessf.f 中的第 1359 行触发的

if(k .gt. 15) call ehg182(105)
Run Code Online (Sandbox Code Playgroud)
或者，有没有人知道可以在这里应用全局（参数）偏移组的局部回归的实现？

或者有没有更好的方法来处理这个问题？我用相关结构尝试了lme，但这似乎要慢得多。

任何意见将不胜感激！

非常感谢，
大卫

### # # loess with parametric offsets - toy data demo # x<-seq(0,9,.1); x.N<-length(x); o<-c(0.4,-0.8,1.2#,-0.2 # works for three but not four ); # these are the (unknown) offsets o.N<-length(o); f<-sapply(seq(o.N), function(n){ ifelse((seq(x.N)<= n *x.N/(o.N+1) & seq(x.N)> (n-1)*x.N/(o.N+1)), 1,0); }); f<-f[sample(NROW(f)),]; y<-sin(x)+rnorm(length(x),0,.1)+f%*%o; s.fs<-sapply(seq(NCOL(f)),function(i){paste('f',i,sep='')}); s<-paste(c('y~x',s.fs),collapse='+'); d<-data.frame(x,y,f) names(d)<-c('x','y',s.fs); l<-loess(formula(s),parametric=s.fs,drop.square=s.fs,normalize=F,data=d, span=0.4); yp<-predict(l,newdata=d); plot(x,y,pch='+',ylim=c(-3,3),col='red'); # input data points(x,yp,pch='o',col='blue'); # fit of that d0<-d; d0$f1<-d0$f2<-d0$f3<-0; yp0<-predict(l,newdata=d0); points(x,y-f%*%o); # spatial distortion lines(x,yp0,pch='+'); # estimate of that op<-sapply(seq(NCOL(f)),function(i){(yp-yp0)[!!f[,i]][1]}); cat("Demo offsets:",o,"\n"); cat("Estimated offsets:",format(op,digits=1),"\n");
Run Code Online (Sandbox Code Playgroud)

Answer 1

Rei*_*son 5

为什么不为此使用加性模型？包mgcv将处理这种模型，如果我理解你的问题，就好了。我可能有这个错误，但是您显示的代码与 x ~ y 相关，但是您的问题提到了 z ~ s(x, y) + g。我在下面展示的gam()是z由空间平滑建模的响应，x并y通过g参数估计，g存储为数据框中的一个因子：

require(mgcv)
m <- gam(z ~ s(x,y) + g, data = foo)

Run Code Online (Sandbox Code Playgroud)

还是我误解了你想要的？如果您想发布一小段数据，我可以使用mgcv给出一个适当的示例...？

归档时间：	14 年，11 月前
查看次数：	2565 次
最近记录：	14 年，11 月前