gpt4 book ai didi

python - 如何使用不同的数据集进行 GridSearchCV 训练和测试?

转载 作者:行者123 更新时间:2023-11-30 09:29:20 25 4
gpt4 key购买 nike

我想找到 RandomForest 分类器(使用 scikit-learn)的最佳参数,使其能够很好地推广到其他数据集(可能不是独立同分布)。我正在考虑使用整个训练数据集进行网格搜索,同时评估其他数据集的评分函数。在 python/scikit-learn 中有一个简单的方法可以做到这一点吗?

最佳答案

我认为您无法对不同的数据集进行评估。 GridSearchCV 背后的整个想法是,它将你的训练集分成 n 个折叠,对其中的 n-1 个折叠进行训练,并对剩余的一个进行评估,重复该过程,直到每个折叠都是“奇数”。这使您不必分开特定的验证集,而只需使用训练集和测试集即可。

关于python - 如何使用不同的数据集进行 GridSearchCV 训练和测试?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40742172/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com