gpt4 book ai didi

python - 使用 sci-kit 中的训练/测试数据而不是交叉验证来学习曲线

转载 作者:行者123 更新时间:2023-11-30 08:50:07 24 4
gpt4 key购买 nike

我有一个单独的训练和测试数据(来自加载到不同 pandas 数据帧的不同 CSV),我想使用此训练和测试数据绘制学习曲线,而不是使用交叉验证从训练集本身生成的训练和测试数据(这似乎是learning_curve 工作的常用方式)。

似乎 scikit 希望您的测试和训练数据出现在同一个 Dataframe 中,但这样分类器也会学习测试数据,这不是我想要的。

我该如何解决这个问题?我是 sci-kit 的新手。

最佳答案

您需要将训练数据和测试数据分开(至少在代码中的单独变量中)。 learning curve然后可以应用于训练集。这样您就可以在不使用测试集的情况下优化实验(以避免过度拟合)。

为了验证您在测试集上的表现,scikit-learn 提供了 validation curve它根据测试集进行评估。

关于python - 使用 sci-kit 中的训练/测试数据而不是交叉验证来学习曲线,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32671975/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com