- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我将如何配置 Keras 以停止训练直到收敛或损失为 0?我故意想要过度拟合它。我不想设置时代数。我只是想让它在收敛时停止。
最佳答案
使用 EarlyStopping打回来。您可以自由选择要观察的损失/指标以及何时停止。
通常,您会查看“验证损失”( val_loss
),因为这是表明您的模型仍在学习泛化的最重要变量。
但是既然你说要过拟合,那你可以看看“训练损失”( loss
)。
回调适用于“deltas”,而不是绝对值,这很好,因为损失不一定以“零”为目标。但是您可以使用 baseline
用于设置绝对值的参数。
所以,通常,一个查看验证损失的回调:
from keras.callbacks import EarlyStopping
usualCallback = EarlyStopping()
EarlyStopping(monitor='val_loss', min_delta=0, patience=0)
相同
overfitCallback = EarlyStopping(monitor='loss', min_delta=0, patience = 20)
patience
论点,这很重要,因为损失值并不总是在每个时期都减少。让模型在结束前继续尝试几个 epoch。
fit
以及大量的时代:
model.fit(X, Y, epochs=100000000, callbacks=[overfitCallback])
关于python - 当网络完全收敛时停止 Keras 训练,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53478622/
我有几个关于我的遗传算法和整体 GA 的问题。 我创建了一个 GA,当给定一条曲线时,它会尝试找出产生这条曲线的函数。 例子如下积分 {{-2, 4},{-1, 1},{0, 0},{1, 1},{2
我正在尝试编写一个 GA 来解决以下难题... 二进制编码(我认为)非常有效。每件作品可以是: 原始向上或翻转的方式 - 1 位 旋转 0(即无)、90、180 或 270 度 - 2 位 在位置 (
我正在编写一个小代码(顺序)来计算适度数据集的网页排名(尽管并非完全微不足道)。 算法是这样的: while ( not converged ) { // Do a bunch of thing
我正在尝试检测长时间序列中的微事件。为此,我将训练一个 LSTM 网络。 数据。每个时间样本的输入是 11 个不同的特征,经过一定程度的标准化以适合 0-1。输出将是两个类之一。 批处理。由于巨大类别
我试图通过使用 optim 函数在 R 中找到最佳 GARCH 模型的参数。但是,我的值(value)观会变得很高,这是没有意义的。我在 MATLAB 中使用 fminsearch 实现了类似的算法,
我运行了 20 倍 cv.glmnet 套索模型以获得 lambda 的“最佳”值。但是,当我尝试重现 glmnet() 的结果时,我收到一条错误消息: Warning messages: 1: fr
我在 dymola 中构建了一个模型。虽然在初始化过程中出现了一些错误,但最终还是计算成功了。 模型收敛成功后,我尝试使用“在模型中保存起始值”选项将正确的迭代变量 strat 值存储到模型中,以便模
我有一个分层 Logit,可以随着时间的推移进行观察。正在关注Carter 2010 ,我添加了时间、时间^2 和时间^3 术语。在添加时间变量之前,模型会使用 Metropolis 或 NUTS 进
再次感谢您花时间阅读这篇文章。 我知道这个问题已经被问了很多,而且我已经检查了很多关于这个问题的帖子:然而,我对使用反向传播的成功 XOR 学习的探索仍未完成。 我按照建议尝试调整学习率、动量、有/无
我是一名优秀的程序员,十分优秀!