gpt4 book ai didi

database - 如何从数据集中制作训练集和测试集?

转载 作者:行者123 更新时间:2023-11-30 09:38:08 26 4
gpt4 key购买 nike

最好的方法是什么:

  1. 将我的数据分为训练集和测试集,将 70% 的数据作为训练数据,30% 的数据作为测试数据,或者
  2. 使用类似的数据进行训练和测试集。

A- 第二种方法正确吗?它有什么缺点?

B- 我的数据集包含 3 个属性和 1000 个对象,这是否适合从此数据集中选择训练集和测试集?

最佳答案

第二种方法是错误的(至少如果“相似”意味着“相同”)。

您不应使用测试集进行训练。

如果您仅使用一个数据集,则只需学习该数据集即可获得完美的准确性(存在过度拟合的风险)。一般来说,这不是您想要的,因为算法应该学习示例背后的一般概念。测试是否发生这种情况的一种方法是使用单独的数据集进行训练和测试。

测试集可以让您预测模型在“现实世界”中的性能,因为它是独立的(在训练/验证阶段,您不会根据测试数据做出任何选择)。

关于database - 如何从数据集中制作训练集和测试集?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23144690/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com