machine-learning - 将验证集与交叉验证方法一起使用是否有意义？-6ren

machine-learning - 将验证集与交叉验证方法一起使用是否有意义？

转载作者：行者123 更新时间：2023-11-30 09:57:41

25

4

我想使用 Weka 训练一个具有约 200 个样本和 6 个属性的多层感知器。我正在考虑分成训练和测试，并在训练中指定训练的一定百分比作为验证集。但后来我考虑使用折叠交叉验证，以便更好地利用我的样本集。

我的问题是:在进行交叉验证方法时指定验证集是否有意义？

并且，考虑到样本的大小，您能为我建议这两种方法的一些数字吗？ (例如 2/3 用于训练，1/3 测试和 20% 验证...对于 CV:10 倍、2 倍或 LOOCV 代替...)

提前谢谢您!

最佳答案

您的问题听起来好像您对交叉验证不太熟悉。就像您注意到的那样，有一个用于运行折叠次数的参数。对于简单的交叉验证，该参数定义了从原始集合中创建的子集的数量。令该参数为 k。您的原始集合被分成 k 个大小相等的子集。然后，对于每次运行，训练都会在 k-1 个子集上运行，并在剩余的第 k 个子集上进行验证。然后用这k个子集的k-1个子集的另一个排列来进行训练，以此类推。因此，您运行此过程的 k 次迭代。

对于您的数据集大小，k=10 听起来不错，但基本上一切都值得测试，只要您考虑所有结果并且不采用最好的结果。

对于非常简单的评估，您只需使用 2/3 作为训练集，1/3“测试集”实际上是您的验证集。还有更复杂的方法，它们使用测试集作为终止标准，并使用另一个验证集作为最终评估(因为您的结果也可能过度拟合测试集，因为它定义了终止)。对于这种方法，您显然需要以不同的方式分割集合(例如 2/3 训练、3/12 测试和 1/12 验证)。

关于machine-learning - 将验证集与交叉验证方法一起使用是否有意义？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/13729986/

25

4

0

文章推荐： machine-learning - 什么是用于特征选择的前馈包装方法？

文章推荐： apache - 使用 Mahout 对数据进行分类

SQL 通过多个列从表中选择不同的行，忽略列顺序(意义)
我有一张 table People (First_Name, Last_Name)。此表包含与示例中一样重复的记录(并非所有行都重复): First_Name Last_Name John
c++ - 指针的真正“意义”是什么？
我用 Java 编写过很多程序，之前也涉足过 C++。我在各种 C++ 书籍中阅读了有关指针的内容，并完成了书籍中的各种示例。我了解指针的基础知识，但有一件事我一直不清楚。指针在现实世界中的应用是什
c# - 配置FluentNHibernate、FluentMappings.AddFromAssembly；意义
线 .Mappings(m => m.FluentMappings.AddFromAssemblyOf() 它有什么作用？它会在派生自 ClassMap 的 Product 类的程序集中查找任
c++ - UTF-16LE 半角和全角？意义？
我有用于打印数字的自定义打印功能。我制作了一个 ASCII 版本和一个 UTF-16LE 版本。 UTF-16LE 版本对 0-9 使用全角代码/字符，对十六进制使用 A-F。在调试我的函数时，我注意
c - float 一个( float )；意义？
这是我的代码片段: float ab(float); 以后 if(ab(temp)
javascript - 什么是 ((window) => { ...})(window);意义
我在一个项目文件中包含以下代码: //begin of the file ((window) => { 'use strict'; class View extends GSM.Event
Windows 身份验证、授权角色/用户 * & ?意义
我一直在到处寻找关于 ? 用法的正确解释。和 *。我注意到我可以使用以下方法拒绝所有用户的访问: 如果我想允许某个组，我应该在其上方添加下一行: 但是当我看到人们使用 ? 时，我开始忘记什么意思，
syntax - 游戏.HUD = 游戏.HUD || {} 意义
我正在关注 melon js tutorial .这是在我的 HUD.js 文件的顶部。 game.HUD = game.HUD || {} 我以前在其他例子中见过这个。 namespace.some
eclipse - 有没有办法在 Eclipse 文件中设置 "waypoints"？意义
我正在处理一个包含数千行代码的文件。我正在第 700 行实现一个算法。我经常不得不离开这些行来检查文件中的其他方法。导航回到我实际编码的地方通常很痛苦。如果我可以在第 700 行设置一个航路点并为其
java - & 符号 C 引用类似于 java 中的运算符。意义？
我遇到了这段代码 do { if (higherQuality && w > targetWidth) { w /= 2; if (w &
c - uint8_t * const LCDMem = (uint8_t *) &LCDM3;意义
uint8_t * const LCDMem = (uint8_t *) &LCDM3; 此代码在 msp430fg4618 培训套件中用于 lcd 配置。谁能解释一下上述代码的含义？它允许使用 a
c - *(void **) &(int[2]){0,PAGE_SIZE};意义？
上下文阅读一些内核代码。问题我不明白这行是什么意思 *(void **) &(int[2]){0,PAGE_SIZE}; 还有更多，这是什么意思 {0,PAGE_SIZE} 对我来说，它看起来不
javascript - 在 JavaScript 或 underscore.js 中可能出现负对象长度？意义？
我正在查看 Underscore.js 的源代码库，专门用于 map方法(该页面第 85 行左右，并复制到此处): _.map = function(obj, iterator, context)
php - 意义？ header ('P3P:CP="IDC DSP COR ADM DEVi TAIi PSA PSD IVAi IVDi CONi HIS OUR IND CNT"');
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开，visit the help center . 关闭 9

首页

博学

6Ren·AI

商城

machine-learning - 将验证集与交叉验证方法一起使用是否有意义？