gpt4 book ai didi

machine-learning - Weka 上的测试准确性与训练时间

转载 作者:行者123 更新时间:2023-11-30 09:49:30 24 4
gpt4 key购买 nike

据我所知,随着训练时间的增加(到某个点),测试的准确性应该会增加;但用 weka 进行的实验却得到了相反的结果。我想知道是否误解了某些内容。我使用糖尿病.arff 进行分类,其中 70% 用于训练,30% 用于测试。我使用MultilayerPerceptron分类器并尝试训练次数100,500,1000,3000,5000。这是我的结果,

   Training time   Accuracy  
100 75.2174 %
500 75.2174 %
1000 74.7826 %
3000 72.6087 %
5000 70.4348 %
10000 68.6957 %

这可能是什么原因?谢谢!

最佳答案

你有一个非常好的过度拟合的例子。

以下是对所发生事件的简短解释:

您的模型(无论是多层感知器、决策树还是其他任何东西)可以通过两种方式拟合训练数据。

第一个是概括 - 模型试图找到模式和趋势并使用它们进行预测。第二个是记住训练数据集中的确切数据点。

想象一下计算机视觉任务:将图像分为两类 - 人类与卡车。好的模型会找到人类图片中存在但卡车图片中不存在的共同特征(平滑曲线、肤色表面)。这是一个概括。这样的模型将能够很好地处理新图片。糟糕的模型,过度拟合的模型,只会记住训练数据集的精确图像、精确像素,并且不知道如何处理测试集上的新图像。

如何防止过度拟合?

处理过度拟合的常见方法有几种:

  1. 使用更简单的模型。参数较少,模型将很难记住数据集
  2. 使用正则化。限制模型的权重和/或在感知器中使用 dropout。
  3. 停止训练过程。再次拆分训练数据,这样您将获得数据的三个部分:训练、开发和测试。然后仅使用训练数据训练模型,并在开发集上的错误停止减少时停止训练。

阅读有关过度拟合的良好起点是维基百科:https://en.wikipedia.org/wiki/Overfitting

关于machine-learning - Weka 上的测试准确性与训练时间,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47563748/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com