gpt4 book ai didi

python - GridSearchCV & RandomizedSearchCV - 运行后是否重新拟合模型

转载 作者:行者123 更新时间:2023-11-30 09:40:42 25 4
gpt4 key购买 nike

我有一些测试和训练数据,测试数据没有任何因变量。

我目前正在运行 GridSearchCV 或 RandomizedSearchCV 来查找最佳参数。

我应该将所有“测试” X 和 y 值传递到 GridSearchCV 或 RandomizedSearchCV 中吗?

我知道它会进行交叉验证,所以我相信它可以吗?

但是如果是这样的话,best_estimator 适合什么数据呢?所有的?或者来自其中一个折叠的数据?

之后需要重新拟合全套测试数据吗?

最佳答案

这里问的问题比较多,我会尽力一一解答。

  1. Should I pass all of my "test" X & y values into a GridSearchCV or RandomizedSearchCV?

您提到您没有测试数据的因变量,在这种情况下,您无法将其传递给您的模型。即使您有权访问因变量的值,也不应将它们发送到您的 GridSearchCVRandomSearchCV,这些方法将在内部创建一个验证集,您的模型将在该验证集上对每个超参数设置进行了测试。

  1. what data has the best_estimator been fit with?

这取决于您初始化 GridSearchCVRandomizedSearchCV 对象的方式,这两种方法都有一个名为 refit 的参数当设置为TRUE(默认情况下)时,将使用整个数据重新拟合模型。

  1. Do I need to refit the full set of test data after?

通常,您不会使用测试数据来调整超参数。您可以使用验证集来完成此操作,一旦卡住了模型,就可以使用测试集来检查模型的性能,这将是对模型性能的无偏估计。

关于python - GridSearchCV & RandomizedSearchCV - 运行后是否重新拟合模型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58892250/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com