gpt4 book ai didi

python - 具有不平衡类的sklearn逻辑回归

转载 作者:IT老高 更新时间:2023-10-28 20:40:59 25 4
gpt4 key购买 nike

我正在用 python 中的 sklearn 逻辑回归解决分类问题。

我的问题是一般/通用问题。我有一个包含两个类/结果(正/负或 1/0)的数据集,但该数据集非常不平衡。有约 5% 的阳性和约 95% 的阴性。

我知道有很多方法可以处理这样的不平衡问题,但没有找到一个很好的解释来说明如何使用 sklearn 包正确实现。

到目前为止,我所做的是通过选择具有正面结果的条目和随机选择的相同数量的负面条目来构建平衡的训练集。然后我可以将模型训练到这个集合,但我不知道如何修改模型以处理原始不平衡的总体/集合。

执行此操作的具体步骤是什么?我翻遍了 sklearn 文档和示例,但没有找到很好的解释。

最佳答案

您是否尝试过传递给您的 class_weight="auto" 分类器?并非 sklearn 中的所有分类器都支持这一点,但有些支持。检查文档字符串。

您还可以通过随机丢弃负样本和/或过度采样正样本(+ 可能会添加一些轻微的高斯特征噪声)来重新平衡数据集。

关于python - 具有不平衡类的sklearn逻辑回归,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14863125/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com