gpt4 book ai didi

R:提升回归树如何处理缺失数据?

转载 作者:行者123 更新时间:2023-12-04 12:41:29 25 4
gpt4 key购买 nike

关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。












想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。

8年前关闭。




Improve this question




默认情况下,增强回归树(包 gbm)的 R 实现如何处理预测变量的缺失值?它们是否被估算,如果是,根据哪种算法?

我的问题的背景:我大约一年前进行了分析,并使用了 Elith 等人提供的脚本。 2008 (A working guide to boosted regression trees, Journal of Animal Ecology 77, 802–813) 调用 gbm。我现在意识到我有一些预测变量的 NA,我想知道增强回归树是如何处理它们的。浏览各种手册和论文,我发现诸如“增强回归树可以容纳缺失值”之类的陈述,但我找不到 gbm 对缺失值所做的事情的准确描述。分析本身运行没有问题,因此 gbm 必须以一种或另一种方式处理它们。在 gbm 手册中甚至有一个例子,其中故意引入 NA 来证明 gbm 可以继续正常工作。现在我想知道 gbm 对 NA 做了什么(跳过它们,估算它们,......?)。

最佳答案

gbm 函数可用于插补 as described in Jeffrey Wongs blog: .缺失值会获得代理拆分,然后用户可以使用不完整的预测器集获得 iems 的预测。

他开发了一个基于这种方法的软件包。 GitHub 存储库在 gbm 文件之一的标题中包含此内容:

#' GBM Imputation
#'
#' Imputation using Boosted Trees
#' Fill each column by treating it as a regression problem. For each
#' column i, use boosted regression trees to predict i using all other
#' columns except i. If the predictor variables also contain missing data,
#' the gbm function will itself use surrogate variables as substitutes for the predictors.
#' This imputation function can handle both categorical and numeric data.

为了找到这个,我只是在谷歌搜索中输入了这个:gbm 如何处理缺失值。这对我来说是第二次打击。

https://github.com/jeffwong/imputation/blob/master/R/gbmImpute.R

关于R:提升回归树如何处理缺失数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18657754/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com