- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我试图确保我不会对 h2o 如何与交叉验证和验证数据集一起工作感到困惑。我确定我只是对用来描述这个的措辞感到困惑
library(mlbench)
library(h2o)
data(Sonar)
dfh2o = as.h2o(Sonar)
splits=h2o.splitFrame(dfh2o)
train = splits[[1]]
valid = splits[[2]]
gbm_no_val_frame <- h2o.gbm(x = colnames(df), y = "Class", training_frame = train,
nfolds = 5, seed = 1234, ntrees = 4000, stopping_rounds = 5)
gbm_val_frame <- h2o.gbm(x = colnames(df), y = "Class", training_frame = train, validation_frame = valid,
nfolds = 5, seed = 1234, ntrees = 4000, stopping_rounds = 5)
h2o.flow() ### to see the validation frame stopping under models.
gbm_no_val_frame 中用于提前停止的验证帧是什么?这如何停止以防止过度拟合?
我想我了解 gbm_val_frame 的工作原理 - 当经过训练的折叠/最终模型命中“有效”框架时分数停止提高时,它会停止过度拟合?
只是想消除我在这里的任何疑问..
最佳答案
How does early stopping work here exactly?
你的假设是正确的。提前停止将用于每个 CV 模型,然后用于最终模型。
If I remove the validation_set here, ...
您没有在示例中指定验证数据集。相反,您通过设置 nfolds
请求交叉验证。
如果您删除 nfolds
并且不指定 validation_frame
,它将使用 training 数据集上的分数来评估何时提前停止应该停止。当您使用 GBM 时,这实际上意味着它不会提前停止:添加每棵额外的树后,GBM 总是会变得更好。
所以,是的,始终指定 validation_frame
或 nfolds
。
基于代码编辑的更新
gbm_no_val_frame
:对于每一个5-fold,1/5的数据被用作验证框架。 最终模型 是使用所有数据构建的。它只会间接使用提前停止:它会忽略您提供的 ntrees
值,而是使用 5 个 cv 模型最终使用的平均树数。 (来源:我书的第 102 页顶部,但它也在 GBM FAQ 中。)
关于你的第二个问题,我对the FAQ的解读表明以上仍然是早期停止的工作方式,并且验证集仅用于为您提供额外的统计数据。
(对于 GBM,我认为这很好;对于深度学习,进展是随机的并且可能有很多噪音,我发现每次折叠的早期停止点可能完全不同,并且对于决定早期停止的作用不大最终模型;所以我通常不喜欢使用 nfolds
,而只使用 validation_frame
)
关于r - 交叉验证和提前停止,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47625766/
如果这有点含糊,我提前道歉,但我什至缺乏如何处理这个问题的基本想法 - 甚至不知道是否有合适的术语可供搜索。 我正在尝试编写一个按时间顺序排列的动画事件的表格驱动系统,其中描述性评论也从表格中提取出来
我是一个老狗,30 年前就用过 BASIC >。我以前在 python 中使用 for 循环时遇到过这种情况,但我选择这个例子是因为我担心循环: 我想解析一个长字符串,其中包含用逗号分隔的双引号中的单
我需要获取从当天算起的 5 个工作日的数组。 今天是:06/04/2018 我需要的输出是: { 0: 06/01/2018, //fri. 1: 05/31/2018, //th
我习惯于使用时间戳,我现在将尝试使用正常日期 2011-02-02 12:00:00 格式 我有这个: SELECT * FROM users_calenders WHERE date ? 我想选择日
我在我的本地仓库 (test-branch) 中创建了一个测试分支,并将其推送到 Github。 如果我转到我的 Github 帐户并选择这个 test-branch 它会显示信息: This bra
我正在尝试设置 JSON 对象的结束日期。结束日期等于开始日期后 30 天。有时这会返回正确的日期,有时则不会。 这是GetDateSchedulerFormatted函数 GetDateSchedu
我有一个执行器服务,它定期执行一堆任务。它们在启动时初始化并经常运行,到目前为止一切顺利。 我现在想添加功能来根据事件快速启动这些任务的执行。 我找到了decorateTask方法,它允许我存储我安排
我需要比当前日期提前 3 周的日期。并将所有日期添加到数组中。我怎样才能得到这个? let date = NSDate() let calendar = NSCalendar(cal
我正在使用以下代码设置日期对象: NSDate *date = [NSDate date]; NSCalendar *gregorian = [[NSCalendar alloc] i
我正在将字符串“Jun 11, 2012 9:30 PM”转换为 NSDate,并且由于某种原因我一直提前 4 小时。有趣的是,我正在使用相同的字符串在详细 View 中提供 UIDatePicker
我的理解是 Xamarin 的提前 (AOT) 编译器将 Xamarin.iOS 应用程序直接编译为 native ARM 汇编代码 (How Xamarin works) . 然而,我不明白的是为什
Angular 2 带有称为提前 (AoT) 的新功能。但是看了一番,还是不能真正理解。它是如何工作的?它将如何带来更好的性能?它与 JIT 有何不同? 谢谢。 最佳答案 Angular 在模块、指令
我看到了一些关于如何纠正这个问题的答案。我有一个 DateTime 类型的对象。我已分配该对象,如下所示。 obj.TimeStamp = DateTime.UtcNow; 我似乎找不到正确的组合或代
我是 Fortran 新手,我不明白这一行: write(*,'(a35)', advance='no') 在: program democonvertion implicit none
我一直在寻找如何做一些像 facebook 新闻提要这样的“高级”列表,但我认为我没有使用正确的关键字来搜索如何做到这一点。我对 android 环境还是很陌生。 这就是我要实现的目标: 我怎样才能得
我有一个包含 2 列的 pandas Dataframe。其中一个是日期格式的索引,另一个是比率 R(0 到 1 之间的数字)。如何向 pandas Dataframe 添加另一列,其中包含一天前一周
我有 2 个媒体查询大小 - only screen and (min-width: 980px)and (max-width: 1499px)"; only screen and (min-widt
我发现了这个: Is AOT (ahead of time) compilation available (or planned) in mono for android? 但是这个问题很老了。 在单
在我看来,当我调用 JTree.expandPath( path ) 默认情况下,它的所有父级也会展开。但我真正想做的是,设置特定的隐形 child 提前展开。这样当一个节点展开时,它的完整子树就会弹
我的时差显示不正确的输出,我正在尝试计算 startTime 和 endTime 之间的时差。 Date time1, time2; long difference; Simp
我是一名优秀的程序员,十分优秀!