gpt4 book ai didi

r - gbm::interact.gbm 与 dismo::gbm.interactions

转载 作者:行者123 更新时间:2023-11-30 08:22:17 28 4
gpt4 key购买 nike

背景

gbm 包 的引用手册指出,interact.gbm 函数计算 Friedman 的 H 统计量以评估变量相互作用的强度。 H 统计量的范围为 [0-1]。

dismo 包的引用手册没有引用任何有关 gbm.interactions 函数如何检测和建模交互的文献。相反,它给出了用于检测和建模交互的一般程序列表。 dismo 小插图“用于生态建模的增强回归树”指出,dismo 包扩展了 gbm 包中的功能。

问题

dismo::gbm.interactions 如何实际检测和建模交互?

为什么

我问这个问题是因为dismo包中的gbm.interactions产生结果>1,gbm包引用手册说的是不可能。

我检查了每个包的 tar.gz 以查看源代码是否相似。它的不同之处足以让我无法确定这两个包是否使用相同的方法来检测和建模交互。

最佳答案

总而言之,两种方法之间的差异归结为如何估计两个预测变量的“部分依赖函数”。

dismo 包基于 Elith et al., 2008 中最初给出的代码您可以在补充 Material 中找到原始来源。该论文非常简要地描述了该过程。基本上,模型预测是通过两个预测变量的网格获得的,按照其平均值设置所有其他预测变量。然后将模型预测回归到网格上。然后将该模型的均方误差乘以 1000。该统计数据表明模型预测与预测变量的线性组合的偏差,表明可能存在交互作用。

dismo包中,我们还可以获得gbm.interactions的相关源代码。交互测试归结为以下命令(直接从源代码复制):

interaction.test.model <- lm(prediction ~ as.factor(pred.frame[,1]) + as.factor(pred.frame[,2]))

interaction.flag <- round(mean(resid(interaction.test.model)^2) * 1000,2)

pred.frame 包含所讨论的两个预测变量的网格,prediction 是原始 gbm 拟合模型的预测,其中所有但正在考虑的两个预测变量是按其平均值设定的。

这与 Friedman 的 H 统计量不同 (Friedman & Popescue, 2005) ,它是通过公式 (44) 对任何一对预测变量进行估计的。这本质上是偏离任何两个预测变量的可加性,对其他变量的值进行平均,而不是按其平均值设置其他变量。它表示为两个变量(或模型隐含预测)的部分相关函数的总方差的百分比,因此始终在 0-1 之间。

关于r - gbm::interact.gbm 与 dismo::gbm.interactions,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29998014/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com