- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有 3 个月的时间序列数据,间隔为 15 分钟。 (一天有96个时段)我有温度列 [Temp] 和太阳辐照度 [SI](太阳强度)列。我的模型必须预测一整天“日前”的温度。即我必须根据前一天的数据预测 96 个时段。当我“自己”评估我的模型并将数据分成训练集和测试集时。我如何分割它们?我应该按照 80:20 的比例进行分配吗?但我的测试数据会有超过一天的读数。或者我应该做一个(3个月 - 1天)-->作为训练,并且只在最后一天进行测试?
最佳答案
实际上,这取决于您的任务。但强烈建议不要在训练集中混合新旧数据。
有几个链接可能对您有用:
http://francescopochetti.com/pythonic-cross-validation-time-series-pandas-scikit-learn/
https://stats.stackexchange.com/questions/117350/how-to-split-dataset-for-time-series-prediction
关于machine-learning - 用于提前一天基础预测模型的评估。对于我的火车测试拆分,我是否执行 80 :20 split or do a (rest of the days : last day) split?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54491158/
对 R 和机器学习非常陌生,但是我必须开展一个项目来根据许多变量(例如,预测客户流失率)来预测客户流失。服务期限、发行的信用票据数量、错过交货的数量、价格上涨的数量等。 我正在使用 rpart 和 r
我有一个流读取准备将特征数据发布到一个已经注册的模型中。所有代码都在 Python 中。以下模型和元数据在常规笔记本中的流之外运行。在流中是另一回事。主要问题是从流中写入的数据(写入目标表)具有 NU
我正在尝试在 keras 中为时间序列实现一个简单的 LSTM 预测模型。我有 10 个时间序列,lookback_window=28,特征数为 1。我需要预测下一个值(timesteps=28,n_
我有一些用 R 语言开发的分类模型,具有 glm、rpart 等函数。从 Java 调用这些模型的计算效率最高的方法是什么?我看过 JRI,但看起来有很多基于文本的 R 调用。 有没有办法以低开销从
假设我有一个每月粒度的数据集,其中包含以下列: 时间戳 问题(即 GitHub 问题的数量) 2016-2019 年每个月都有数据,所以我相应地划分了数据。 training_data : 2016-
我是一名优秀的程序员,十分优秀!