gpt4 book ai didi

machine-learning - 具有预测功能的机器学习再训练模型

转载 作者:行者123 更新时间:2023-11-30 09:36:00 25 4
gpt4 key购买 nike

我有一个模型,它使用前几天的数据来预测今天的情况。 (使用0:t-1数据来预测t数据)

现在我想扩展这个模型来预测接下来的 n 天。然而,不要仅使用 0:t-1 数据来预测 t、t+1、t+2 等;我还想使用对 t、t+1 等进行的预测来重新训练模型并分别对 t+1、t+2 等进行预测。

因此对于 t 的预测:使用 0:t-1 数据

对于 t+1 的预测:使用 0:t-1 数据 + 上述 t 的预测。

对于 t+2 的预测:使用 0:t-1 数据 + 上面 t 的预测 + 上面 t+1 的预测

这是 ML 社区公认的做法吗?最好的方法是什么?

我的简单解决方案:我使用 t-1 数据进行训练。对 t 进行预测。使用 t-1 + t 预测重新训练。对 t+1 进行预测。等等。

我面临的问题:训练模型需要一些时间(约 1.5-2 分钟),每天重复这个过程似乎是违反直觉的。当我运行 100 天来进行预测时,大约需要 3 小时。

最佳答案

您的问题(甚至包括您的评论)相当模糊,因为它没有描述模型的输入数据。当您说“使用预测 x”时,也存在歧义,因为“使用”可能意味着用作训练数据或用作训练模型的输入。

您不应使用预测数据来重新训练您的模型。如果您的模型不完美(如果是,则没有理由重新训练),您将创建一个乱伦模型,该模型根据自己的输出进行训练,并将使用自己的错误作为“真相”标签。

在您的评论中,您提到有一个“现实生活事件”提供了正确(真相)的标签。当您收到新的真实数据时,重新训练您的模型当然是可以接受的。

您可以通过多种方式处理处理问题。最好的方法取决于模型的详细信息,但通常需要考虑以下一些选项:

  • 只需等待 N 天即可重新训练模型。
  • 仅在模型做出错误预测时重新训练模型。
  • 限制用于再训练的数据量(例如,仅使用M 最近几天的数据)。

关于“使用”预测和/或新的真实数据,可以通过使用将 N 天的数据序列作为输入的模型来重新训练整个模型。例如,您可以使用 t-N-1:t-1 天来预测 t 天。然后 - 无需重新训练模型 - 使用 t-N:t 天来预测 t+1 天。这可以通过预测或新的真值来完成。 N 的具体大小应取决于模型和输入数据的详细信息(例如,是否考虑日期/季节变化)。

关于machine-learning - 具有预测功能的机器学习再训练模型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42694800/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com