gpt4 book ai didi

xgboost 正确使用 auc 指标

转载 作者:行者123 更新时间:2023-12-03 17:38:50 30 4
gpt4 key购买 nike

对于二元分类问题,我有一个略微不平衡的数据集,正负比为 0.6。
我最近从这个答案中了解到了 auc 指标:https://stats.stackexchange.com/a/132832/128229 ,并决定使用它。

但我发现了另一个链接 http://fastml.com/what-you-wanted-to-know-about-auc/它声称,AUC-ROC 对类别不平衡不敏感,我们应该将 AUC 用于精确召回曲线。

xgboost 文档不清楚他们使用哪个 AUC,他们使用 AUC-ROC 吗?
该链接还提到,只有在您不关心概率而只关心排名时才应使用 AUC。

但是,由于我使用的是 binary:logistic 目标,我认为我应该关心概率,因为我必须为我的预测设置一个阈值。

xgboost 参数调优指南 https://github.com/dmlc/xgboost/blob/master/doc/how_to/param_tuning.md
还提出了一种处理类不平衡的替代方法,即不平衡正负样本并使用 max_delta_step = 1。

所以有人可以解释一下,AUC 何时优先于 xgboost 处理类不平衡的其他方法。如果我使用 AUC ,我需要为预测设置的阈值是多少,或者更一般地说,我应该如何使用 AUC 来处理 xgboost 中的不平衡二元分类问题?

编辑:

我还需要消除误报而不是误报,除了简单地改变阈值之外,我如何实现这一点,二进制:逻辑目标?

最佳答案

根据 here 中的 xgboost 参数部分有aucaucpr哪里pr代表精确召回。
我会说你可以通过运行这两种方法来建立一些直觉,看看指标的表现。您可以包含多个指标,甚至可以根据您的喜好进行优化。
您还可以通过创建自定义指标来监控每个提升轮中的误报(率)。

关于xgboost 正确使用 auc 指标,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41562676/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com