gpt4 book ai didi

r - 为什么在 "mgcv::s"中使用 "gam(y ~ mgcv::s...)"会导致错误?

转载 作者:行者123 更新时间:2023-12-01 22:37:31 26 4
gpt4 key购买 nike

我想澄清并在行中使用 :: 表示法来拟合 mgcv::gam。在使用 mgcv::s 模型调用中的符号时,我偶然发现了一件事。具有可重现示例/错误的代码如下所示。

原因可能是因为我在模型公式中使用了这种表示法,但我无法弄清楚为什么这不起作用/不允许。这可能是关于语法的非常具体的事情(我猜可能不是 mgcv 特定的),但也许有人可以帮助我理解这一点以及我对 R 的理解。提前谢谢你。

library(mgcv)
dat <- data.frame(x = 1:10, y = 101:110)
# this results in an error: invalid type (list)...
mgcv::gam(y ~ mgcv::s(x, bs = "cs", k = -1), data = dat)
# after removing the mgcv:: in front of s everything works fine
mgcv::gam(y ~ s(x, bs = "cs", k = -1), data = dat)

# outside of the model call, both calls return the desired function
class(s)
# [1] "function"
class(mgcv::s)
# [1] "function"

最佳答案

说明

library(mgcv)
#Loading required package: nlme
#This is mgcv 1.8-24. For overview type 'help("mgcv-package")'.

f1 <- ~ s(x, bs = 'cr', k = -1)
f2 <- ~ mgcv::s(x, bs = 'cr', k = -1)

OK <- mgcv:::interpret.gam0(f1)$smooth.spec
FAIL <- mgcv:::interpret.gam0(f2)$smooth.spec

str(OK)
# $ :List of 10
# ..$ term : chr "x"
# ..$ bs.dim : num -1
# ..$ fixed : logi FALSE
# ..$ dim : int 1
# ..$ p.order: logi NA
# ..$ by : chr "NA"
# ..$ label : chr "s(x)"
# ..$ xt : NULL
# ..$ id : NULL
# ..$ sp : NULL
# ..- attr(*, "class")= chr "cr.smooth.spec"

str(FAIL)
# list()

interpret.gam0源代码第4行揭示了问题:

head(mgcv:::interpret.gam0)

1 function (gf, textra = NULL, extra.special = NULL)
2 {
3 p.env <- environment(gf)
4 tf <- terms.formula(gf, specials = c("s", "te", "ti", "t2",
5 extra.special))
6 terms <- attr(tf, "term.labels")

"mgcv::s"不匹配,你就会遇到问题。但是mgcv通过传递 "mgcv::s" 确实可以让您有空间解决这个问题通过参数extra.special :

FIX <- mgcv:::interpret.gam0(f, extra.special = "mgcv::s")$smooth.spec
all.equal(FIX, OK)
# [1] TRUE

只是这在高级例程中不是用户可控的:

head(mgcv::gam, n = 10)

#1 function (formula, family = gaussian(), data = list(), weights = NULL,
#2 subset = NULL, na.action, offset = NULL, method = "GCV.Cp",
#3 optimizer = c("outer", "newton"), control = list(), scale = 0,
#4 select = FALSE, knots = NULL, sp = NULL, min.sp = NULL, H = NULL,
#5 gamma = 1, fit = TRUE, paraPen = NULL, G = NULL, in.out = NULL,
#6 drop.unused.levels = TRUE, drop.intercept = NULL, ...)
#7 {
#8 control <- do.call("gam.control", control)
#9 if (is.null(G)) {
#10 gp <- interpret.gam(formula) ## <- default to extra.special = NULL

我同意本·博尔克的观点。挖掘内部发生的情况是一个很好的练习,但将其视为错误并修复它是一种过度 react 。

<小时/>

更多见解:

s , temgcvstats::poly 的逻辑不同和splines::bs .

  • 例如,当您执行 X <- splines::bs(x, df = 10, degree = 3) 时,它评估 x并创建一个设计矩阵X直接。
  • 当你这样做时s(x, bs = 'cr', k = 10) ,不做评价;它被解析

mgcv施工顺利需要几个阶段:

  1. mgcv::interpret.gam解析/解释,生成更平滑的配置文件;
  2. 初步 build 者mgcv::smooth.construct ,设置基础/设计矩阵和惩罚矩阵(主要在 C 级完成);
  3. 二次施工mgcv::smoothCon ,它选取“by”变量(例如,复制因子“by”的平滑)、线性函数项、零空间惩罚(如果使用 select = TRUE )、惩罚重新缩放、居中约束等;
  4. 最终整合者:mgcv:::gam.setup ,它将所有平滑器组合在一起,返回模型矩阵等。

所以,这是一个复杂得多的过程。

关于r - 为什么在 "mgcv::s"中使用 "gam(y ~ mgcv::s...)"会导致错误?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51051732/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com