gpt4 book ai didi

machine-learning - 在监督多类分类中,为什么使用宏 F1 分数而不是平衡精度?

转载 作者:行者123 更新时间:2023-11-30 08:38:01 24 4
gpt4 key购买 nike

假设我有一个 3 类问题,我想构建一个分类器,可以根据一组特征区分不同的类。我想根据模型区分 3 个类别的能力来评估该模型。

从我的阅读来看,宏 F1 分数听起来像是用于评估多类问题分类器的常用指标,其中计算每个类的 F1 分数,然后将这些 F1 分数的未加权平均值用作 macro F1 score .

在其他文献中,我看到了多类问题中使用的平衡精度,其中计算每个类的精度,然后将这些精度的未加权平均值用作 balanced accuracy .

为什么宏 F1 分数比平衡精度更受青睐?

平衡精度是否更容易解释,因为平衡精度 < 0.5 告诉我们模型的性能比机会差?

我们如何以与平衡准确率相同的方式解释 F1 分数 - 什么阈值表明分类器比机会做得更好/更差?

最佳答案

我认为,F1分数是基于精确率和召回率的,可以适用于更多情况。例如,负样本比正样本少得多。

关于machine-learning - 在监督多类分类中,为什么使用宏 F1 分数而不是平衡精度?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35878212/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com