gpt4 book ai didi

performance - 什么是差、不错、好和优秀的 F1 测量范围?

转载 作者:行者123 更新时间:2023-11-30 08:22:17 26 4
gpt4 key购买 nike

我理解 F1-measure 是精确率和召回率的调和平均值。但是什么值定义了 F1 度量的好坏呢?我似乎找不到任何引用文献(谷歌或学术)来回答我的问题。

最佳答案

考虑sklearn.dummy.DummyClassifier(strategy='uniform')这是一个进行随机猜测的分类器(也称为坏分类器)。我们可以将 DummyClassifier 视为要击败的基准,现在让我们看看它的 f1-score。

在二元分类问题中,具有平衡数据集:总共 6198 个样本,其中 3099 个样本标记为 0以及标记为 1 的 3099 个样本,f1 分数为 0.5对于这两个类别,加权平均值为 0.5 :

strategy_uniform

第二个示例,使用 DummyClassifier(strategy='constant') ,即每次都猜测相同的标签,猜测标签 1每次在这种情况下,f1 分数的平均值为 0.33 ,而 f1 为标签 00.00 :

strategy_constant

我认为这些 f1 分数很糟糕,考虑到平衡数据集

PS。使用 sklearn.metrics.classification_report生成的摘要

关于performance - 什么是差、不错、好和优秀的 F1 测量范围?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36706453/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com