gpt4 book ai didi

python - 术语准确性和验证准确性之间有什么区别

转载 作者:行者123 更新时间:2023-12-04 02:49:18 25 4
gpt4 key购买 nike

我使用Keras的LSTM构建了一个模型,该模型可以检测Stack Overflow上的两个问题是否重复。运行模型时,我会在时代中看到类似的东西。

Epoch 23/200
727722/727722 [==============================] - 67s - loss: 0.3167 - acc: 0.8557 - val_loss: 0.3473 - val_acc: 0.8418
Epoch 24/200
727722/727722 [==============================] - 67s - loss: 0.3152 - acc: 0.8573 - val_loss: 0.3497 - val_acc: 0.8404
Epoch 25/200
727722/727722 [==============================] - 67s - loss: 0.3136 - acc: 0.8581 - val_loss: 0.3518 - val_acc: 0.8391


我试图理解每个术语的含义。以上哪个值是我模型的准确性。我是机器学习的新手,所以任何解释都将有所帮助。

最佳答案

在训练机器学习模型时,您要避免的主要事情之一就是过拟合。这是您的模型很好地适合训练数据的时候,但是它无法对以前从未见过的数据进行概括和准确预测。

为了弄清楚他们的模型是否过拟合,数据科学家使用了一种称为交叉验证的技术,将数据分为两部分-训练集和验证集。训练集用于训练模型,而验证集仅用于评估模型的性能。

训练集上的指标可让您查看模型在训练方面的进展情况,而验证集上的指标可让您衡量模型的质量-能够基于数据做出新预测的程度它从未见过。

考虑到这一点,损失和acc是训练集上损失和准确性的量度,而val_loss和val_acc是验证集合上损失和准确性的量度。

目前,您的模型在训练集上的准确度约为86%,在验证集上的准确度约为84%。这意味着您可以期望模型在新数据上的准确度达到〜84%。

我注意到随着您的时代从23到25,您的acc指标增加,而val_acc指标减少。这意味着您的模型更适合训练集,但失去了对新数据进行预测的能力,这表明您的模型已开始适应噪声并且开始过拟合。

因此,这是有关验证指标及其解释方式的快速说明。

关于python - 术语准确性和验证准确性之间有什么区别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51344839/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com