gpt4 book ai didi

r - (R) 从 gbm.step 绘制树状图 BRT 模型

转载 作者:行者123 更新时间:2023-12-03 19:11:41 24 4
gpt4 key购买 nike

(之前发过here,发错子了,信息不足,已关闭,我编辑了,编辑好像被删除了,帖子归于炼狱,所以抱歉重新发,我不知道之前的帖子是否可以/应该复活)

在 R 中,我使用 dismo 运行了一些 Boosted Regression Trees,即广义 Boosting Models。使用 gbm .让人们到达我目前所在位置的可重现示例:

library(dismo); data(Anguilla_train)
angaus.tc5.lr01 <- gbm.step(data=Anguilla_train, gbm.x = 3:13, gbm.y = 2, family = "bernoulli", tree.complexity = 5, learning.rate = 0.01, bag.fraction = 0.5)

(来自 here)。这将为您留下 gbm 模型对象“angaus.tc5.lr01”。
我想根据 De'ath 2007 生成 split (折叠?)的树状图,即绘制树木(见图,左 Pane )。但是:De'ath 的图是单个回归树,而不是增强回归树,它是潜在数千棵树的平均值,每棵树都使用从数据集中随机抽取的不同数据集。

用户 克卢斯 好心建议 rpart,但是这需要由 rpart 生成的模型所以不适用于 gbm.step 生产的 BRT/GBM . prp 也是如此来自 rpart.plot .
pretty.gbm.treegbm为选定的任何一棵树提取一个信息矩阵(尝试 pretty.gbm.tree(angaus.tc5.lr01, i.tree=1) 第一个)所以我想知道这是否可能是通向成功的合理途径?例如。通过编写一些使用所有可用树创建平均树矩阵的脚本,然后将其转换为树状对象,可能使用某些方法 here .

人们提出了各种类似的问题,似乎在网上其他地方都没有成功。 BRT 模型经常被描述为“黑匣子”,所以普遍的看法是人们不应该/能够/费心去探究它们并显示它们的内部过程。

如果有人足够了解 BRT/ gbm并有任何想法,他们将不胜感激。
谢谢。

De'ath tree diagram

最佳答案

正如您所指出的,对决策树集合的解释比解释单个树要困难得多。在几何上,您可以将决策树集成视为复杂的高维曲面的近似值。目标是找到有助于近似的变量,并可视化它们的影响。

解释集成的基本思想不是获得“平均”树,或获得任何单个树的图,而是可视化变量的“平均”效果。在文献中,这是预测变量的“部分依赖”——它的效果是使其他变量保持不变。 “部分依赖”是如何估计的,描述起来有点复杂,但它是模型隐含的预测,仅允许预测变量 j 变化,对于观察 i。然后对所有 i 个观察结果进行平均预测。见 Friedman & Popescue (2008)血淋淋的细节。

然后,您可以根据预测变量的实际值绘制预测变量的估计依赖性(或我所说的“隐含模型”)效应。这让您可以看到预测变量的模型隐含效果。

好消息是可以在 dismo 中获得这样的图。很容易。见 gbm.plot对于单个预测变量,gbm.perspec对于涉及两个预测变量的透视图。小插图还提供了示例。为了进一步帮助解释模型,gbm.interactions提供了一种检测可能的 2 或 3 向交互的方法。见 this question有关详细信息。

关于r - (R) 从 gbm.step 绘制树状图 BRT 模型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28025662/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com