gpt4 book ai didi

machine-learning - 如何避免训练数据的过度拟合?

转载 作者:行者123 更新时间:2023-11-30 08:32:05 25 4
gpt4 key购买 nike

我是一个生物信息学项目,我有大量的训练数据集。它由大约 18,000 个正实例和 1000 个负实例组成。如果我使用这些数据作为训练集,那么正实例将完全优于负实例。所以,在对测试数据进行分类时,我的负数数据也被错误地分类为正数。

是否有任何简单的方法可以平衡这些正负数据来解决这个问题?

最佳答案

很宽泛的问题,但一般来说你可以大致区分以下几种处理过拟合的方法:

在训练示例不平衡的情况下,据报道,一个分类器与所有分类器的集成可以产生良好的结果(例如 here )。您还可以使用采样技术(可以通过谷歌找到很多不同的命题)。

关于machine-learning - 如何避免训练数据的过度拟合?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20331468/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com