machine-learning - 准确度随训练数据大小的变化而波动-6ren

machine-learning - 准确度随训练数据大小的变化而波动

转载作者：行者123 更新时间：2023-11-30 09:21:21

24

4

我目前正在做一个项目。我遇到一个问题，分类器的准确性随着训练数据集的大小而波动。例如:

Training data set% |Accuracy %
10%                | 50
20%                | 60
30%                | 55
40%                | 65
50%                | 80
60%                | 70
....               | ...

我的疑问是我选择了较弱的特征..就像这些特征非常多样化并且没有主导特征。有没有人有其他解决方案？

最佳答案

这种“波动”意味着您的模型具有很高的方差，这可能是由数据集的大小引起的。如果您不想观察波动，您的训练集大小(使用 10%!)应该足够大以能够代表您的问题。如果您的问题至少有点复杂，并且不是简单的二维二元分类，这意味着您可能应该收集约 10,000 个样本(因此 10% 是 1000)。否则的话——这并没有什么奇怪的。您可以尝试以引导方式收集这种准确性(通过替换进行采样以创建训练集)并重复数百次 - 这应该会在不牺牲统计意义的情况下稳定结果。

关于machine-learning - 准确度随训练数据大小的变化而波动，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/36819628/

24

4

0

文章推荐： java - 周期计算中 Joda-Time 的奇怪行为

文章推荐： javafx tableview 仅在排序后更新数据

文章推荐： machine-learning - 多语言文本垃圾邮件检测

flutter - 波动-实际值和显示值之间的差异
我面临一个非常奇怪的问题。我想实现从DataTable中删除行的选项，因此实现了以下方法: onRemoveRow() { setState( () { last
javascript - 抑制值(value)波动，滤除尖峰
我正在 JavaScript 中处理物理问题，并且我有一个值指示“物理”世界中的接触数量。这个值可以在0-6之间。问题是i波动很大。我想要的是过滤掉尖峰。假设该数字是 3，然后在不到一秒的时间内它会变
c - C变量中是否有可能 "Turn off"或 "Turn on"波动？
我在 C 中有两个静态可变变量，我想在逻辑语句中检查它们。但是，当我这样做时，我收到警告“未定义的行为:此语句 1037 中未定义 volatile 访问的顺序”是否有可能在很短的时间内暂停 C 变量
c# - XNA Platformer (2D) - 帧率/FPS 波动
我是 C Sharp 的新手，正在使用 XNA Framework 编写游戏。我创建了一个项目，它是“Platformer”XNA 入门工具包的重大修改版本。我看到(看似)随帧率随机波动。有时它会一

首页

博学

6Ren·AI

商城

machine-learning - 准确度随训练数据大小的变化而波动