gpt4 book ai didi

python - 我应该先 train_test_split 然后使用交叉验证吗?

转载 作者:太空宇宙 更新时间:2023-11-03 14:27:41 25 4
gpt4 key购买 nike

如果我计划使用交叉验证 (KFold),我是否仍应将数据集拆分为训练数据和测试数据并仅在训练集上执行训练(包括交叉验证)?或者简历会为我做一切吗?例如

选项1

X_train, X_test, y_train, y_test = train_test_split(X,y)
clf = GridSearchCV(... cv=5)
clf.fit(X_train, y_train)

选项2

clf = GridSearchCV(... cv=5) 
clf.fit(X y)

最佳答案

CV 很好,但最好将训练/测试分开,以便对未受影响的数据提供独立的分数估计。如果您的 CV 和测试数据显示的分数大致相同,那么您可以在整个数据上放弃训练/测试分阶段和 CV,以获得稍微更好的模型分数。但在确定您的分割分数和 CV 分数一致之前,请勿执行此操作。

关于python - 我应该先 train_test_split 然后使用交叉验证吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47510135/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com