gpt4 book ai didi

python - 类别权重与欠采样/过采样

转载 作者:行者123 更新时间:2023-11-28 18:01:12 25 4
gpt4 key购买 nike

在不平衡分类(使用 scikit-learn)中,平衡类(即将 class_weight 设置为平衡)与使用 SMOTE 进行过采样有什么区别?两者的预期效果是什么?

最佳答案

类权重通过对具有更多(或更少)权重的类给予更多(或更少)惩罚来直接修改损失函数。实际上,通过故意使模型偏向于更准确地预测较高权重类(少数类),基本上是牺牲了预测较低权重类(不平衡数据集的多数类)的能力。

过采样和欠采样方法本质上也为特定类别赋予更多权重(重复观察会重复对这些特定观察的惩罚,从而使它们对模型拟合产生更大影响),但由于通常在训练中发生的数据拆分,这将也会产生略有不同的结果。

请引用https://datascience.stackexchange.com/questions/52627/why-class-weight-is-outperforming-oversampling

关于python - 类别权重与欠采样/过采样,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55657807/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com