gpt4 book ai didi

machine-learning - 在多类分类中,如何计算每个类的 F1 度量?

转载 作者:行者123 更新时间:2023-11-30 08:50:56 24 4
gpt4 key购买 nike

我使用SciKit作为一个库来处理分类算法,例如:NB、SVM。

这是一个非常漂亮的binary classification implementation对于“垃圾邮件HAM电子邮件:

    confusion += confusion_matrix(test_y, predictions)
score = f1_score(test_y, predictions, pos_label=SPAM)
//note in my case 3-classes I do not need to set [pos_label]

如果我有三个类(例如 {SPAM、HAM、NORMAL})而不是两个,那么:我如何调整该代码来为每个类以及所有类查找 F1-Score 作为 < em>平均水平。

最佳答案

这里的问题是,F1 度量对于多类问题来说并没有真正的意义。它是精确率和召回率之间的调和平均值。

精度是(随机选择的)正分类实例为正的概率。

召回率是(随机选择的)正例被分类为正例的概率。

这些定义本质上是二元的。通常我会分别给出每个类别的 F1 度量。这还允许您决定哪些类型的故障是您可以接受的。根据我个人的经验,我实际上会给出精确度和召回率。在您的示例中,将火腿电子邮件分类为垃圾邮件将是极其有害的。因此,SpAM 的精确度比召回率更重要。

要获得更广泛的概述(还包含措施列表),您还可以查看 http://rali.iro.umontreal.ca/rali/sites/default/files/publis/SokolovaLapalme-JIPM09.pdf

关于machine-learning - 在多类分类中,如何计算每个类的 F1 度量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34578423/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com