gpt4 book ai didi

R:训练数据集的 k 折交叉验证

转载 作者:行者123 更新时间:2023-11-30 08:46:10 25 4
gpt4 key购买 nike

我正在使用R中的C5.0对心脏病数据集进行一些分类任务,在最常见的情况下,数据将被分为80%用于训练,20%用于测试, 我想使用 k 折交叉验证(k=10),但我对这一点感到困惑,因为我们知道通过使用 10 折交叉验证,我们会将整个数据分为 9 个子集用于训练和一个子集用于测试。

是否可以将数据分为 80% 用于训练,20% 用于测试,然后对训练数据应用 k 折交叉验证?或者我必须对整个数据集应用 k 折交叉验证?

最佳答案

一个选项是 k=5。在本例中,您使用 80% 进行训练,并使用 20% 进行测试。但为此,您不需要使用 k 折交叉验证。

k 折交叉验证始终针对整个数据集。因此,当 k=5 时,有 5 种可能的场景需要进行测试和比较。

关于R:训练数据集的 k 折交叉验证,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47392434/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com