gpt4 book ai didi

带有 mlr3::autoplot() 的 Roc 曲线用于 "holdout"重采样的基准

转载 作者:行者123 更新时间:2023-12-04 14:10:54 48 4
gpt4 key购买 nike

我正在使用 mlr3 包,我想绘制不同模型的 ROC 曲线。如果我按照 documentation 中的说明使用交叉验证它工作得很好,但是如果我使用“holdout”进行重采样,那么我会得到一个错误 Error: Invalid show_cb。与 evalmod 的 calc_avg 不一致。.

代码如下:

library("mlr3")
library("mlr3learners")
library("mlr3viz")

# one task only
tasks = lapply(c("german_credit"), tsk)

# get some learners and for all learners ...
# * predict probabilities
# * predict also on the training set
learners = c("classif.featureless", "classif.rpart", "classif.ranger", "classif.kknn")
learners = lapply(learners, lrn,
predict_type = "prob")

# compare via 3-fold cross validation
resamplings = rsmp("holdout", ratio = .8) # holdout instead of cv

# create a BenchmarkDesign object
design = benchmark_grid(tasks, learners, resamplings)
print(design)

bmr = benchmark(design)
autoplot(bmr, type = "roc")

感谢您的帮助,马修

最佳答案

如果其他人遇到同样的问题,这里有一个解决方案。出现问题是因为参数 calc_avg设置为 TRUE默认为 precrec::evalmod()并且函数按原样在 mlr3viz::autoplot() 中使用.自 as_precrec()返回一个没有不同 dsid 的对象(在交叉验证的情况下,不同的值来自不同的折叠,而 holdout 只有一个元素)然后 precrec 的平均值是不可能的因此错误(尽管理论上它可以)。

这是一段代码,可用于绘制带保留(或任何其他类型的重采样)的 ROC 曲线。使用答案中的代码,我们可以执行以下操作:

roc_data <- evalmod(as_precrec(bmr), mode = "rocprc", calc_avg = FALSE)  %>% # setting calc_avg to FALSE is critical
fortify() %>% # precrec objects have a fortify generic function
.[.$curvetype == "ROC", ] # both roc and prc are returned

# Tracer les courbes
ggplot(
data = roc_data,
mapping = aes(x = x, y = y, color = modname)
) +
geom_line()

此代码还具有成为 ggplot 的优点对象,以便可以使用 ggplot2 轻松修改它precrec::autoplot() 不是这种情况.

关于带有 mlr3::autoplot() 的 Roc 曲线用于 "holdout"重采样的基准,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64424267/

48 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com