gpt4 book ai didi

machine-learning - 样本权重在分类模型中如何发挥作用?

转载 作者:行者123 更新时间:2023-11-30 09:28:33 34 4
gpt4 key购买 nike

为每个样本提供权重意味着什么 分类?像 Logistic 回归或 SVM 这样的分类算法如何使用权重来比其他示例更强调某些示例?我很想详细了解这些算法如何利用样本权重。

如果你看看sklearn documentation for logistic regression ,您可以看到拟合函数有一个可选的sample_weight参数,该参数定义为分配给各个样本的权重数组。

最佳答案

此选项适用于不平衡数据集。让我们举个例子:我有很多数据,有些只是噪音。但其他对我来说非常重要,我希望我的算法比其他点更多地考虑它们。所以我给它分配了一个权重,以确保它得到正确的处理。

它改变了损失的计算方式。误差(残差)将乘以点的权重,因此目标函数的最小值将发生变化。我希望它足够清楚。我不知道你是否熟悉它背后的数学,所以我在这里提供一个小介绍,以掌握所有内容(如果不需要,请道歉) https://perso.telecom-paristech.fr/rgower/pdf/M2_statistique_optimisation/Intro-ML-expanded.pdf

关于machine-learning - 样本权重在分类模型中如何发挥作用?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51924558/

34 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com