gpt4 book ai didi

python - 使用非线性 SVM 时如何解释类​​别权重?

转载 作者:太空宇宙 更新时间:2023-11-04 01:03:05 25 4
gpt4 key购买 nike

我正在使用 Scikit-learn SVM 分类器进行预测,并且我正在使用 rbf 内核。我已经设置了 class_weight = 'auto'。我认为更频繁出现的类(class)会获得更低的权重是否正确?假设我有两个类(class),A 和 B。如果 A 出现的次数比 B 多,这是否意味着稍后在进行预测时,A 的预测会比我没有设置 class_weight= 'auto' 时少?

我对此很陌生,所以我只是想了解正在发生的事情以及原因。

最佳答案

使用类权重与线性/非线性内核无关。它只是控制训练期间错误分类特定样本的成本。每类权重只是对给定类中的每个样本施加恒定权重。当您使用 auto 时,类样本的权重与类大小成反比。因此,如果你的 A 类是 B 的两倍,那么来自 A 的样本会“便宜”两倍而导致错误分类。这将导致高度平衡的模型结构,特别是,此类 SVM 试图最大化平衡精度 (BAC),而不是“经典”精度。

关于python - 使用非线性 SVM 时如何解释类​​别权重?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31944799/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com