gpt4 book ai didi

machine-learning - 构建模型,在两个类别之间的差异过大时做出决策

转载 作者:行者123 更新时间:2023-11-30 09:48:10 25 4
gpt4 key购买 nike

目前我正在构建一个 ML 模型,用于使用分类器根据某些条件做出决策。顺便说一句,我收集的数据太不正常了:假设我的数据分为A类和B类,A类和B类的记录比例约为1:300。

有什么方法可以处理这个模型吗?我尝试了很多不同的方法,但结果都是过度拟合。

最佳答案

您所说的“太异常”的问题在机器学习、数据挖掘、统计等社区中被称为“数据集不平衡”。这就是类(Class)代表不平等的情况。

这种情况并不罕见。事实上,在许多分类问题中,感兴趣的事件并不经常发生,这就是它令人感兴趣的原因。因此,与其他标签相比,此事件发生的标签非常罕见。

有很多不同的方法来处理不平衡的数据集,并且在大多数情况下,尝试使其平衡。欠采样和过采样是典型的方法。通常,这两者的结合可以得到更好的结果。

第一个 Google 建议给了我这个:

关于machine-learning - 构建模型,在两个类别之间的差异过大时做出决策,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49604710/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com