gpt4 book ai didi

r - R 中 Ranger 的 SHAP 重要性

转载 作者:行者123 更新时间:2023-12-05 09:36:38 29 4
gpt4 key购买 nike

有一个二元分类问题:如何获得 Ranger 模型变量的 Shap 贡献?

示例数据:

library(ranger)
library(tidyverse)

# Binary Dataset
df <- iris
df$Target <- if_else(df$Species == "setosa",1,0)
df$Species <- NULL

# Train Ranger Model
model <- ranger(
x = df %>% select(-Target),
y = df %>% pull(Target))

我尝试了几个库(DALEXshaprfastshapshapper)但我没有得到任何解决方案。

我希望得到一些像 SHAPforxgboost 这样的 xgboost 的结果,比如:

  • shap.values 的输出,即变量的形状贡献
  • shap.plot.summary

最佳答案

早上好!根据我的发现,您可以将 ranger() 与 fastshap() 一起使用,如下所示:

library(fastshap)
library(ranger)
library(tidyverse)
data(iris)
# Binary Dataset
df <- iris
df$Target <- if_else(df$Species == "setosa",1,0)
df$Species <- NULL
x <- df %>% select(-Target)
# Train Ranger Model
model <- ranger(
x = df %>% select(-Target),
y = df %>% pull(Target))
# Prediction wrapper
pfun <- function(object, newdata) {
predict(object, data = newdata)$predictions
}

# Compute fast (approximate) Shapley values using 10 Monte Carlo repetitions
system.time({ # estimate run time
set.seed(5038)
shap <- fastshap::explain(model, X = x, pred_wrapper = pfun, nsim = 10)
})

# Load required packages
library(ggplot2)
theme_set(theme_bw())

# Aggregate Shapley values
shap_imp <- data.frame(
Variable = names(shap),
Importance = apply(shap, MARGIN = 2, FUN = function(x) sum(abs(x)))
)

然后例如,对于变量重要性,你可以这样做:

# Plot Shap-based variable importance
ggplot(shap_imp, aes(reorder(Variable, Importance), Importance)) +
geom_col() +
coord_flip() +
xlab("") +
ylab("mean(|Shapley value|)")

enter image description here

此外,如果您想要单独的预测,则可以执行以下操作:

# Plot individual explanations
expl <- fastshap::explain(model, X = x ,pred_wrapper = pfun, nsim = 10, newdata = x[1L, ])
autoplot(expl, type = "contribution")

所有这些信息都可以在这里找到,还有更多信息:https://bgreenwell.github.io/fastshap/articles/fastshap.html检查链接并解决您的疑问! :)

enter image description here

关于r - R 中 Ranger 的 SHAP 重要性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65005700/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com