gpt4 book ai didi

machine-learning - 训练数据对比测试数据

转载 作者:行者123 更新时间:2023-11-30 09:50:18 26 4
gpt4 key购买 nike

这听起来像是一个基本问题,但我对训练集和测试有很大的困惑。

当我们使用分类等监督学习技术来预测某些内容时,常见的做法是将数据集分为训练集和测试集两部分。训练集将有一个预测变量,我们在数据集上训练模型并“预测”事物。

我们举个例子。我们将预测银行的贷款违约者,我们有德国信贷数据集,我们在其中预测违约者和非违约者,但已经有一个定义列,说明客户是违约者还是非违约者。

我理解对 UNSEEN 数据(例如泰坦尼克号生存数据)进行预测的逻辑,但是对于已经提到的类别(例如德国信贷数据)进行预测有何意义。

最佳答案

正如您所说,我们的想法是提出一个可以预测未知数据的模型。测试数据仅用于衡量通过训练数据创建的模型的性能。您需要确保您提出的模型不会“过度拟合”您的训练数据。这就是为什么测试数据很重要。最终,您将使用该模型来预测新贷款人是否会违约,从而做出是否批准贷款申请的业务决策。

关于machine-learning - 训练数据对比测试数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46136163/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com