gpt4 book ai didi

machine-learning - 深度学习: small dataset with keras : local minima

转载 作者:行者123 更新时间:2023-11-30 08:34:03 24 4
gpt4 key购买 nike

对于我的论文,我正在运行一个 4 层深度网络,用于序列到序列翻译用例最后阶段的 150 x Conv(64,5) x GRU (100) x softmax 激活,loss='categorical_crossentropy'。

训练损失和准确率很快就达到最佳收敛验证损失和准确性似乎停留在 val_acc 97 到 98.2 范围内,无法超越该范围。

我的模型是否过度拟合?

尝试过层间 0.2 的 dropout。

Output after drop-out
Epoch 85/250
[==============================] - 3s - loss: 0.0057 - acc: 0.9996 - val_loss: 0.2249 - val_acc: 0.9774
Epoch 86/250
[==============================] - 3s - loss: 0.0043 - acc: 0.9987 - val_loss: 0.2063 - val_acc: 0.9774
Epoch 87/250
[==============================] - 3s - loss: 0.0039 - acc: 0.9987 - val_loss: 0.2180 - val_acc: 0.9809
Epoch 88/250
[==============================] - 3s - loss: 0.0075 - acc: 0.9978 - val_loss: 0.2272 - val_acc: 0.9774
Epoch 89/250
[==============================] - 3s - loss: 0.0078 - acc: 0.9974 - val_loss: 0.2265 - val_acc: 0.9774
Epoch 90/250
[==============================] - 3s - loss: 0.0027 - acc: 0.9996 - val_loss: 0.2212 - val_acc: 0.9809
Epoch 91/250
[==============================] - 3s - loss: 3.2185e-04 - acc: 1.0000 - val_loss: 0.2190 - val_acc: 0.9809
Epoch 92/250
[==============================] - 3s - loss: 0.0020 - acc: 0.9991 - val_loss: 0.2239 - val_acc: 0.9792
Epoch 93/250
[==============================] - 3s - loss: 0.0047 - acc: 0.9987 - val_loss: 0.2163 - val_acc: 0.9809
Epoch 94/250
[==============================] - 3s - loss: 2.1863e-04 - acc: 1.0000 - val_loss: 0.2190 - val_acc: 0.9809
Epoch 95/250
[==============================] - 3s - loss: 0.0011 - acc: 0.9996 - val_loss: 0.2190 - val_acc: 0.9809
Epoch 96/250
[==============================] - 3s - loss: 0.0040 - acc: 0.9987 - val_loss: 0.2289 - val_acc: 0.9792
Epoch 97/250
[==============================] - 3s - loss: 2.9621e-04 - acc: 1.0000 - val_loss: 0.2360 - val_acc: 0.9792
Epoch 98/250
[==============================] - 3s - loss: 4.3776e-04 - acc: 1.0000 - val_loss: 0.2437 - val_acc: 0.9774

最佳答案

您提出的案例非常复杂。为了回答您的问题是否确实发生了过度拟合,您需要回答两个问题:

  1. 验证集获得的结果是否令人满意?-验证集的主要目的是让您了解新数据到达时会发生什么。如果您对验证集的准确性感到满意,那么您应该考虑您的模型没有过度拟合。
  2. 我应该担心您的模型在训练集上的极高准确性吗?-您可能很容易注意到您的模型在训练集上几乎是完美的。这可能意味着它记住了一些模式。通常,您的数据中总是存在一些噪音,并且您的模型在数据上完美的属性意味着它可能会使用其部分能力来学习偏差。为了测试这一点,我通常更喜欢测试得分最低的正样本或得分最高的负样本 - 因为异常值通常位于这两组中(模型正在努力将它们推到高于/低于 0.5 阈值) .

因此,在检查了这两个问题之后,如果您的模型过度拟合,您可能会得到答案。您呈现的行为非常好 - 背后的实际原因可能是验证集中很少有模式没有在训练集中得到正确覆盖。但在设计机器学习解决方案时,您应该始终考虑到这一点。

关于machine-learning - 深度学习: small dataset with keras : local minima,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45188140/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com