machine-learning - 如何避免训练数据的过度拟合？-6ren

machine-learning - 如何避免训练数据的过度拟合？

转载作者：行者123 更新时间：2023-11-30 08:32:05

我是一个生物信息学项目，我有大量的训练数据集。它由大约 18,000 个正实例和 1000 个负实例组成。如果我使用这些数据作为训练集，那么正实例将完全优于负实例。所以，在对测试数据进行分类时，我的负数数据也被错误地分类为正数。

是否有任何简单的方法可以平衡这些正负数据来解决这个问题？

最佳答案

很宽泛的问题，但一般来说你可以大致区分以下几种处理过拟合的方法:

在训练示例不平衡的情况下，据报道，一个分类器与所有分类器的集成可以产生良好的结果(例如 here )。您还可以使用采样技术(可以通过谷歌找到很多不同的命题)。

关于machine-learning - 如何避免训练数据的过度拟合？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/20331468/

html - 想要使背景图像和颜色都 react 过度
我正在开发适用于 Wordpress 的 PSD，并面临着根据颜色过度对齐背景图像或相反的问题。在桌面上一切都很好，但在移动设备上背景图像变小了(我使用了 background-size: 100%
modelica - 过度/欠定 Modelica 源的最佳实践
在标准 Modelica 流体流量源中，通常指定流量或压力。例如，以下边界设置(P 表示压力边界，F 表示流量边界)通常会围绕管道组件: P - 管道 - P F - 管道 - P 但是，有时在同一侧
azure - (过度)使用 Azure 队列的最佳实践
我正处于设计基于 Azure 的应用程序的早期阶段。考虑到我可能预期的需求的变化性，Azure 吸引我的地方之一是它的可扩展性。因此，我试图保持事物松散耦合，以便我可以在需要时添加实例。我看到的关于
objective-c - Xcode 4 点符号代码感觉 react 过度
我与 Xcode 4 dot notation code sense problem 正好相反!点符号的代码完成不仅显示属性，还显示我的方法(在每个完成的左侧标记 P 或 M 分别指示它是属性还是方法

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章