gpt4 book ai didi

machine-learning - OneVsRestClassifier 的损失函数

转载 作者:行者123 更新时间:2023-11-30 08:36:25 24 4
gpt4 key购买 nike

我有一个已经过训练的 OneVsRestClassifier (scikit-learn)。

clf = OneVsRestClassifier(LogisticRegression(C=1.2, penalty='l1')).fit(X_train, y_train)

我想找出我的测试数据的损失。我使用了 log_loss 函数,但它似乎不起作用,因为我有多个类作为每个测试用例的输出。我该怎么办?

最佳答案

您所指的分类问题被称为 Multi-Label Classification问题。为此,您做出了使用 OneVsRestClassifier 的明智决定。默认情况下score方法使用子集准确性,这是一个非常严格的指标,因为它要求您正确猜测整个标签子集。

您可以使用 scikit-learn 提供的一些其他损失函数,如下所示:

  1. Hamming Loss - 这测量标签预测与真实标签之间的汉明距离。 This是理解汉明距离的直观公式。
  2. Jaccard Similarity Coefficient Score - 这衡量了预测标签与真实标签之间的 Jaccard 相似度。
  3. Precision, Recall and F-Measures - 在多标签分类的情况下,精度、召回率和 F 测量的概念可以独立应用于每个类别。 following guide解释了如何在多标签分类中将它们跨所有标签组合。

如果您还需要像在多标签排名问题中那样对标签进行排名,那么 scikit-learn 中还有其他更高级的技术,这些技术有很好的示例记录 here 。如果您正在处理此类问题,请在评论中告诉我,我将更详细地解释每个指标。

希望这有帮助!

关于machine-learning - OneVsRestClassifier 的损失函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38093770/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com