time-series - 将随机森林用于时间序列数据集-6ren

time-series - 将随机森林用于时间序列数据集

转载作者：行者123 更新时间：2023-12-02 01:33:48

27

4

对于时间序列数据集，我想做一些分析并创建预测模型。通常，我们会将数据(通过在整个数据集中随机抽样)拆分为训练集和测试集，并使用带有 randomForest 函数的训练集。并保留测试部分以检查模型的行为。

但是，有人告诉我，时间序列数据无法通过随机抽样来拆分数据。

如果有人解释如何将数据拆分为时间序列数据的训练和测试，我将不胜感激。或者如果有任何替代方法来做时间序列随机森林。问候

最佳答案

我们生活在一个“ future 与过去的因果关系”只出现在炫酷的科幻电影中的世界。因此，在对时间序列建模时，我们希望避免用 future 事件来解释过去事件。此外，我们还想验证我们的模型是否能够根据过去的事件进行严格训练，从而解释 future 的事件。

使用 RF 滚动对时间序列 T 进行建模。对于第 t 天，值 T[t] 是目标值 T[t-k]，其中 k= {1,2,...,h}，其中 h 是过去的地平线，将用于形成特征。对于非平稳时间序列，T 被转换为例如相对改变Trel。 = (T[t+1]-T[t])/T[t].

为了评估性能，我建议检查 RF 的袋外交叉验证措施。请注意，有一些陷阱可能会使该指标过于乐观:

过去污染的未知 future - 不知何故滚动是错误的，模型使用 future 事件来解释训练集中的相同 future 。
非独立抽样:如果您要提前预测的时间间隔短于计算相对变化的时间间隔，则您的样本不是独立的。
我还不知道的其他可能的错误

最后，每个人都可能以某种潜在的方式犯上述错误。要检查没有发生这种情况，您需要通过回溯测试来验证您的模型。每天都由仅根据过去事件严格训练的模型进行预测。

当 OOB-CV 和回溯测试完全不一致时，这可能是代码中存在某些错误的提示。

要进行回测，请在 T[t-1 到 t-traindays] 上滚动。对此训练数据建模并预测 T[t]。然后将 t 加一，t++，并重复。

为了加快速度，您可以只训练一次模型或在每第 n 个 t 增量时训练您的模型。

关于time-series - 将随机森林用于时间序列数据集，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/32476944/

27

4

0

文章推荐： xcode - 摆脱或抑制 Xcode 中的警告 CGSReenableUpdate？

文章推荐： kendo-ui - Kendo UI 试用限制

文章推荐： android - relativeLayout 设置为 wrap_content 与 alignParentRight？

MarkLogic 森林无效的跨设备链接
我们正在运行 MarkLogic 9.0-11 版本 3 节点集群，并且 MarkLogic 安装在“/var/opt/MarkLogic/”目录中，我们创建了“/var/opt/MarkLogic/
javascript - 我如何弄平一片(森林)树木？
我有一片任意高度的森林，大致像这样: let data = [ { "id": 2, "name": "AAA", "parent_id": null, "short_name": "A" },
machine-learning - 何时使用回归树/森林？
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。这个问题似乎与 help center 中定义的范围内的编程无关。 . 已关闭 7 年前。 Improve
python - 将深度很大的嵌套字典(森林)写入文本文件
我有一个巨大的深度字典，代表森林(许多非二叉树)，我想处理森林并创建一个包含森林所有可能关系的文本文件，例如给定字典: {'a': {'b': {'c': {}, 'd': {}}, 'g': {}}
android - 获取android上某个位置的区域类型(森林/街道/水域)
在我的 Android 应用程序中，我包含了谷歌地图。现在我想获取有关您周围地区的信息。例如，你是在公园/森林/海滩……所以我基本上想要一个用“水”回答输入坐标 53°33'40.9"N 10°00'
sql-server-2008 - 多个层次结构(森林？)中的成员到一个表中
如果我有下表: Member_Key Member_Name col1 Mem1 col2 Mem2 col3 Mem3 col4
python - 将深度很大的嵌套字典(森林)写入 BFS 样式的文本文件
继续我的老问题: Writing nested dictionary (forest) of a huge depth to a text file 现在我想把森林遍历写成BFS风格:我有一个巨大的深
ssl - 如何使用单个 SSL 证书保护多域(Active Directory 森林)环境中的所有 Web 服务器？
我有一个多域环境(事件目录林)，例如subdomain1.mydomain.com, subdomain2.mydomain.com 其中 mydomain.com 是根 AD 域 (GC) 和 su
c# - 如何恢复具有地形类型(水、森林、平原..)Google/Bing map 的 2D map ？
我想知道是否有可能在 Google map 或 Bing Mag 2D/3D map 上恢复地形类型(山脉、森林、水域、平原等...) 。为了根据玩家在现实世界中的位置生成 map !我认为可用 AP

首页

博学

6Ren·AI

商城

time-series - 将随机森林用于时间序列数据集