gpt4 book ai didi

machine-learning - 通过了解一些 future 事件来增强预测

转载 作者:行者123 更新时间:2023-11-30 08:47:55 26 4
gpt4 key购买 nike

使用 AWS Forecast 时,是否有某种方法可以使用“部分 future 信息”来增强我们的模型,以改进预测?

到目前为止,我已经从 AWS Forecast 获得了相当可靠的预测,但我怀疑,如果我能够提供一些有关已知 future 事件的信息,我可以在一定程度上改进预测。

我对预测和机器学习非常陌生,我所说的“部分 future 信息”是指:

  • 我正在尝试预测变量 X 的时间序列在未来的表现
  • 我正在使用许多不同变量(包括 X)的过去时间序列信息来训练模型
  • 我还想为这些变量的子集提供已知的 future 时间序列信息,因为 1) 它们应该对预测产生重大影响,2) 这将使我能够执行“假设”分析

更具体地说:

  • 我试图根据过去的收入、网络流量、广告支出和促销折扣来预测 future 的收入
  • 到目前为止,AWS Forecast 一直为我提供了良好的预测(我从模型中保留了好几个月的已知数据,并且它对“ future ”的预测与已知数据非常匹配)
  • 但是,我确实还想告诉 AWS Forecast,例如计划在不久的将来开展的一项重要广告事件
  • 我还非常希望能够改变一些 future 的变量,看看它们如何影响结果(“如果我下个月在广告上花费 Z 美元会怎样?”)

目前,我将所有过去的收入、网络流量、广告支出和促销折扣信息作为“目标时间序列”以包含 3 列的单个 CSV 文件的格式提供给 AWS Forecast(指标名称、时间戳、度量值);大约 15 个不同的指标名称值;总共约 10,000 行数据(15 个变量的数年每日值 = ~ 2 * 365 * 15 = ~ 11,000 行)。每个指标均在同一时间间隔内提供(例如,所有指标均在 2017 年 10 月 1 日至 2019 年 11 月 25 日期间提供)。

我想提供一些额外的部分数据,突出显示已知的 future 重大事件(广告支出、促销折扣),以进一步改进我们的预测。

例如:

  • 2017年10月1日至2019年11月25日收入
  • 2017年10月1日至2019年11月25日的网络流量
  • 2017年10月1日至2019年11月25日的广告支出
  • 2017年10月1日至2019年11月25日期间的促销折扣
  • 加上2019 年 11 月 26 日至 2020 年 2 月 1 日的计划广告支出

有人可以帮助我了解一些术语和“操作方法”机制吗?

最佳答案

一般来说,要使用历史数据中的变量,您还需要对其 future 进行预测。这就像尝试预测用电量,然后将历史温度放入数据集中。如果您没有对 future 气温的预测,那么这些信息对您改善预测没有任何帮助。因为现在我知道“温度升高一度对用电的影响”是什么,但是“如果我不知道明天的温度是多少,我该怎么办?”

在您的案例中,您有 1 个想要预测的指标(收入)和 3 个支持数据:流量、广告支出、折扣。很高兴您有 future 的广告支出,但如果没有其他两项,您就有点运气不好(根据前一段)。

但是,您仍然可以在这里做一些事情,但您只需要做出一些假设。我要做的是为 future 的所有日期选择一个固定值,并为所有 future 的日期设置该值。也许合适的值是零折扣(全价商品)和每天 1K 的网络流量(这是我编的)。现在您拥有过去和 future 的完整数据集。

完成此设置后,您现在可以回答问题了,尽管有一个警告。您得出的预测现在显示...

Here's how much revenue we can expect given our planned ad spend, if we offer no discounts and we get 1K people to the website every day.

也许您可以通过输入与前一年相同的 future 流量值来改进这一点。在这种情况下,你现在可以说...

Here's how much revenue we can expect given our planned ad spend, if we offer no discounts and the website gets the same traffic as this time last year.

您可以将其理解为诸如“流量增加 10%”之类的变体,或者您可以猜测折扣是多少,或者像以前一样,您可以复制一年前的折扣和流量并说.. .

Here's how much revenue we can expect given our planned ad spend, if we offer discounts just like last year and see website traffic just like last year.

我怀疑你明白了,所以我会停止所有的变化。当然,这些实际上只是对这些数据的 future 预测;然而,“创建预测”折扣或网络流量并不一定很复杂和花哨,这是毫无值(value)的。 “与去年相同”是对 future 的完全有效的“预测”。

关于machine-learning - 通过了解一些 future 事件来增强预测,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59144383/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com