gpt4 book ai didi

machine-learning - 机器学习模型泛化

转载 作者:行者123 更新时间:2023-11-30 09:43:13 25 4
gpt4 key购买 nike

我是机器学习新手,我想提出一个有关模型泛化的问题。就我而言,我将生产一些机械零件,并且我对控制输入参数以获得最终零件的某些属性感兴趣。

更具体地说,我对 8 个参数感兴趣(例如,P1、P2、...、P8)。为了优化生产所需零件的数量以最大化所探索的参数组合,我将问题分为 2 组。对于第一组作品,我将改变前 4 个参数(P1 ... P4),而其他参数将保持不变。在第二种情况下,我将执行相反的操作(变量 P5 ... P8 和常量 P1 ... P4)。

所以我想知道是否可以制作一个以八个参数作为输入的单一模型来预测最终零件的属性。我问这个问题是因为我不会同时改变所有 8 个变量,我想也许我必须为每组参数做 1 个模型,并且 2 个不同模型的预测不能相互关联.

提前致谢。

最佳答案

在大多数情况下,使用两个不同的模型比使用一个大模型具有更好的准确性。原因是在局部模型中,模型只会查看 4 个特征,并且能够识别其中的模式来进行预测。

但这种特殊的方法肯定无法扩展。现在你只有两组数据,但如果它增加并且你有 20 组数据怎么办?您无法在生产环境中创建和维护 20 个 ML 模型。

什么最适合您的情况需要进行一些实验。从数据中随机抽取样本并训练 ML 模型。采用一个大模型和两个本地模型并评估它们的性能。不仅是准确性,还有 F1 分数、AUC-PR 和 ROC 曲线,以找出最适合您的方法。如果您没有看到性能大幅下降,那么整个数据集的一个大模型将是更好的选择。如果您知道您的数据将始终分为这两组并且您不关心可扩展性,那么请使用两个本地模型。

关于machine-learning - 机器学习模型泛化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56331444/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com