python - ScikitLearn 中关于 epoch 的学习曲线解读-6ren

python - ScikitLearn 中关于 epoch 的学习曲线解读

转载作者：行者123 更新时间：2023-11-30 09:44:25

28

4

我是机器学习新手，目前正在使用 ScikitLearn 的 MLPClassifier 来执行神经网络任务。根据 Andrew Ng 著名的机器学习类(class)，我正在绘制学习曲线，在我的例子中，使用 ScikitLearn 的函数learning_curve(另请参阅文档:https://scikit-learn.org/stable/auto_examples/model_selection/plot_learning_curve.html):

clf = MLPClassifier(solver='adam', activation='relu', alpha=0.001,
 learning_rate='constant',learning_rate_init=0.0001,
 hidden_layer_sizes=[39, 37, 31, 34],   batch_size=200,
 max_iter=1000, verbose=True) 


cv=GroupKFold(n_splits=8)

estimator =clf
ylim=(0.7, 1.01)
cv=cv
n_jobs=1
train_sizes=np.linspace(.01, 1.0, 100)


#Calculate learning curve
train_sizes, train_scores, test_scores = learning_curve(
    estimator, X_array_train, Y_array_train,
    groups=groups_array_train, cv=cv, n_jobs=n_jobs,
    train_sizes=train_sizes, scoring='accuracy',verbose=10)

我的 MLPClassifier 求解器是“adam”，批量大小为 200。

这是结果图: https://i.imgur.com/jDNoEVg.png

关于此类学习曲线的解释，我有两个问题:

1.) 据我了解这条学习曲线，它为我提供了不同数量的训练数据的训练和交叉验证分数，直到一个时期结束(时期=一次前向传递和一次反向传递)所有训练示例)。看看这两者之间的“差距”以及它们最终的得分，我可以诊断是否存在高偏差或方差问题。然而，根据我的 MLPClassifier 的详细信息，神经网络正在多个时期进行训练，因此曲线中给出了哪个时期(训练的第一个时期，最后一个时期还是所有时期的平均分数？) 。或者我对时代有什么误解？

2.) 开始一个新批处理(在 200 和 400 个训练示例之后)，我得到了峰值。解释它们的正确方法是什么？

3.) 可能理解 1.) 也会回答这个问题:是什么让这个函数如此缓慢，以至于你需要几个并行作业 n_jobs 才能在合理的时间内完成它？ clf.fit(X,y) 在我的情况下很快。

如果有人能帮助我更好地理解这一点，我将非常感激。我也愿意接受文献推荐。

非常感谢!

最佳答案

学习曲线只能在稳定的、可推广的模型上计算。您确保模型不会过度拟合吗？

1) 估计器被训练至完成，即训练至最终时期或任何早期停止阈值。这是多少取决于您的估算器配置。事实上，learning_curve 函数根本没有纪元的概念。它也可以应用于不使用纪元的分类器。

2) 与总样本数相比，您的批量大小非常大。考虑较小的批量大小，可能是 50 或 20。猜测:可能对于 201 个 sample ，您最终会得到一批 200 个和一批 1。那批 1 可能会导致问题。

3) 学习曲线将为每个训练样本选择的每个交叉验证折叠进行训练。就您而言，您似乎正在测试所有 500 种可能的训练规模。如果 CV 为 5 倍，则将进行 2500 轮训练。如果没有并行化，这需要 1 fit()+predict() 的 2500 倍。相反，您应该只对一些训练集大小进行采样。 train_sizes = numpy.linspace(0.0, 1.0, 30) 用于数据 0% 到 100% 之间的 30 个点。

关于python - ScikitLearn 中关于 epoch 的学习曲线解读，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54327491/

28

4

0

文章推荐： java - RESTEasy UnavailableException HttpServletDispatcher

文章推荐： javascript - 如何在不同的复选框 Angular 之间切换

文章推荐： java - 在 jfreechart 上显示标签

文章推荐： javascript - 页面重新加载后保留按钮属性

javascript - 如何找出相对于基本 Epoch 值最接近的 Epoch 时间最大值
这个问题已经有答案了: Find closest date in array with JavaScript (6 个回答) 已关闭 4 年前。我有一个基本纪元时间值和一个纪元时间数组以及相应纪元时
machine-learning - model.save() 保存的是最后一个 epoch 的模型还是最好的 epoch 的模型？
这个单线用于保存keras深度学习神经网络模型。 model.save('my_model.h5') model.save()保存的是最后一个epoch的模型还是最好的epoch的模型？有时，最后一个
python - 为什么 epoch 2 比 epoch 1 花费的时间多 18 倍？
我在 keras 中有以下神经网络(可能没有必要对其进行审查来回答我的问题: 简短摘要:它是一个以图像作为输入并输出图像的神经网络。神经网络主要是卷积网络。我使用发电机。另外，我有两个回调:一个用于
python - 如何在 CNN 中绘制 epoch 与 val_acc 和 epoch 与 val_loss 图？
我使用卷积神经网络 (CNN) 来训练数据集。这里我得到 epoch、val_loss、val_acc、总损失、训练时间等作为历史记录。如果我想计算准确率的平均值，那么如何访问 val_acc，以及如
tensorflow - Epoch 需要越来越多的时间
我可能有一个“臃肿的图表”，请参阅( Why does tf.assign() slow the execution time? )，因为每个纪元都花费越来越多的时间，但我在代码中看不到它。你能帮助我
javascript - $(...).epoch 不是函数类型错误
我正在尝试从网站 http://epochjs.github.io/epoch/real-time 运行一个基本示例我收到以下错误 jQuery.Deferred exception: $(...).
java - Epoch 迄今为止无法正常工作
我正在尝试使用 SimpleDateFormat 进行简单的纪元到日期的转换。每当我运行该程序时，我都会在转换后收到无效日期。我已经在转换器中运行了纪元戳 [并且我还在外部服务器中存储了日期]，所以我
time - 如何将自 Epoch 以来的秒数转换为当前日期和时间？
我知道我不久前发布了这个，但我想出了解决方案。我为名为 Roblox 的游戏编写了此代码，但我只是在此处发布代码，以防其他遇到相同问题的人需要解决方案。无论如何，这是代码: outputTime =
Epoch 或 iso8601 日期格式？
为了在 JSON 中传递时间到/从 Web API，为什么我会选择使用 ISO8601 字符串而不是简单的 UTC 纪元值？例如，这两者是相同的: Epoch = 1511324473 iso8601
epoch 期间的 Pytorch 闪电保存模型
每次验证循环结束时，我都想保存一个检查点。我设置了val_check_interval成为 0.2所以我在每个时期有 5 个验证循环，但检查点回调仅在时期结束时保存模型。我找不到在每个验证循环后保存模
python - TensorFlow 数据集洗牌每个 Epoch
在 manual在 Tensorflow 中的 Dataset 类上，它展示了如何对数据进行混洗以及如何对其进行批处理。然而，如何对每个时期的数据进行洗牌并不明显。我已经尝试了下面的方法，但是数据在第
TensorFlow 损失函数在第一个 epoch 后归零
我正在尝试基于本文实现一个判别性损失函数，例如图像分割:https://arxiv.org/pdf/1708.02551.pdf (此链接仅供读者引用；我不希望有人阅读它来帮助我!) 我的问题:一旦我
Azure数据工厂映射数据流: Epoch timestamp to Datetime
我有一个基于 JSON 的源，我想使用 ADF 映射数据流进行转换。我有一个包含纪元时间戳值的字符串，我想将其转换为日期时间值，以便稍后将其放入 Parquet 文件中。你知道方法吗？这种语言的文档
Azure数据工厂映射数据流: Epoch timestamp to Datetime
我有一个基于 JSON 的源，我想使用 ADF 映射数据流进行转换。我有一个包含纪元时间戳值的字符串，我想将其转换为日期时间值，以便稍后将其放入 Parquet 文件中。你知道方法吗？这种语言的文档
java - 如何从字符串转换为 Epoch 微秒？
我有一个以下格式的字符串:“2019-08-17T09:51:41.775+00:00”。我需要将其转换为纪元微秒，但我的转换总是相差一个小时。这是我目前的代码: String timestamp
python - 是什么导致训练准确度和 epoch 之间损失的大幅跃升？
在 Python 中的 Tensorflow 2.0 中训练神经网络时，我注意到训练精度和损失在不同时期之间发生了巨大变化。我知道打印的指标是整个 epoch 的平均值，但在每个 epoch 之后准确
python - 我试图在神经网络训练中理解 'epochs'。接下来的实验是等价的吗？
假设我有一个定义的神经网络的训练样本(带有相应的训练标签)(神经网络的架构对于回答这个问题无关紧要)。让我们称神经网络为“模型”。为了不产生任何误解，假设我介绍了“模型”的初始权重和偏差。实验 1
pandas - 将几列转换为 epoch pandas
我正在尝试将以下列转换为纪元，为机器学习做准备，我的 csv 的其余部分包含字符串，所以我假设这是最好的方法，我尝试创建一个 numpy 数组并使用 datetime 对其进行转换，等等但这不起作用我
javascript - Date epoch 是安全的唯一标识符吗？
我正在编写一个 Node API 并得到一个模型，我必须为其生成一个15 位随机数。这必须是唯一的，并且不应看起来微不足道(我无法获得自动增量)。我真的不想生成数字并查询 Mongo 数据库以进行存
machine-learning - epoch 和训练步骤是一回事吗？
features = [tf.contrib.layers.real_valued_column("x", dimension=1)] estimator = tf.contrib.learn.Lin

首页

博学

6Ren·AI

商城

python - ScikitLearn 中关于 epoch 的学习曲线解读