gpt4 book ai didi

r - R 中是否有 loess 的实现具有超过 3 个参数预测变量或类似效果的技巧?

转载 作者:行者123 更新时间:2023-12-04 00:47:22 24 4
gpt4 key购买 nike

召集所有专家研究局部回归和/或R!

我在 R 中遇到了标准 loess 函数的限制,希望您能给我一些建议。当前的实现仅支持 1-4 个预测器。让我列出我们的应用场景,以说明为什么一旦我们想要使用全局拟合参数协变量,这很容易成为一个问题。

本质上,我们有一个空间失真 s(x,y) 叠加在多个测量 z 上:

z_i = s(x_i,y_i) + v_{g_i}

这些测量值 z 可以根据每个组 g 的相同基础未失真测量值 v 进行分组。组成员资格 g_i 对于每个测量都是已知的,但是组的潜在未失真测量值 v_g 是未知的,应该由(全局,而不是局部)回归来确定。

我们需要估计二维空间趋势 s(x,y),然后我们要将其移除。在我们的应用程序中,假设在最简单的场景中有 20 组,每组至少 35 次测量。测量值是随机放置的。以第一组为参照,有19个未知偏移量。

玩具数据的以下代码(在一维 x 中具有空间趋势)适用于两个或三个偏移组。

不幸的是,loess 调用失败并显示错误消息的四个或更多偏移量组

Error in simpleLoess(y, x, w, span, degree, parametric, drop.square,
normalize, :
only 1-4 predictors are allowed"

我尝试覆盖限制并得到了

k>d2MAX in ehg136.  Need to recompile with increased dimensions.

这有多容易?我在任何地方都找不到 d2MAX 的定义,而且这似乎是硬编码的——该错误显然是由 loessf.f

中的第 #1359 行触发的
if(k .gt. 15)   call ehg182(105)

或者,有人知道可以在此处应用的具有全局(参数)偏移组的局部回归的实现吗?

或者有更好的方法来处理这个问题吗?我用相关结构尝试了 lme,但这似乎慢得多。

如有任何意见,我们将不胜感激!

非常感谢,
大卫

###
#
# loess with parametric offsets - toy data demo
#

x<-seq(0,9,.1);
x.N<-length(x);

o<-c(0.4,-0.8,1.2#,-0.2 # works for three but not four
); # these are the (unknown) offsets
o.N<-length(o);
f<-sapply(seq(o.N),
function(n){
ifelse((seq(x.N)<= n *x.N/(o.N+1) &
seq(x.N)> (n-1)*x.N/(o.N+1)),
1,0);
});
f<-f[sample(NROW(f)),];

y<-sin(x)+rnorm(length(x),0,.1)+f%*%o;
s.fs<-sapply(seq(NCOL(f)),function(i){paste('f',i,sep='')});
s<-paste(c('y~x',s.fs),collapse='+');
d<-data.frame(x,y,f)
names(d)<-c('x','y',s.fs);

l<-loess(formula(s),parametric=s.fs,drop.square=s.fs,normalize=F,data=d,
span=0.4);
yp<-predict(l,newdata=d);
plot(x,y,pch='+',ylim=c(-3,3),col='red'); # input data
points(x,yp,pch='o',col='blue'); # fit of that

d0<-d; d0$f1<-d0$f2<-d0$f3<-0;
yp0<-predict(l,newdata=d0);
points(x,y-f%*%o); # spatial distortion
lines(x,yp0,pch='+'); # estimate of that

op<-sapply(seq(NCOL(f)),function(i){(yp-yp0)[!!f[,i]][1]});

cat("Demo offsets:",o,"\n");
cat("Estimated offsets:",format(op,digits=1),"\n");

最佳答案

为什么不为此使用加法模型? mgcv 包将处理这种模型,如果我理解你的问题,就好了。我可能有这个错误,但你显示的代码与 x ~ y 相关,但你的问题提到 z ~ s(x, y) + g。我在下面显示的 gam() 是响应 zxy 中的空间平滑建模的g 被参数估计,g 作为一个因素存储在数据框中:

require(mgcv)
m <- gam(z ~ s(x,y) + g, data = foo)

还是我误解了你的意思?如果您想发布一小段数据,我可以使用 mgcv... 给出一个适当的示例?

关于r - R 中是否有 loess 的实现具有超过 3 个参数预测变量或类似效果的技巧?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6370361/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com