gpt4 book ai didi

python - 处理 RNN/LSTM 中的缺失数据(时间序列)

转载 作者:行者123 更新时间:2023-11-28 16:19:45 28 4
gpt4 key购买 nike

正如标题所暗示的,我有一个时间序列数据集,并且有很多缺失的数据。对于 LSTM 模型,处理此问题的最佳方法是什么?

为了提供更多详细信息,我有大约五个数据源来创建数据集,其中一些不允许我获取历史数据,因此我缺少该源中的很多功能。我可以使用最近观察到的样本来填充一些,但在大多数情况下这是不可能的。

我看到的一些建议是:

  • 隐马尔可夫模型
  • 期望最大化
  • 使用神经网络预测缺失值

但尽管如此,我觉得我会失去很多数据完整性。这通常是如何处理的/在 LSTM 模型中对此进行调整的最佳方法是什么?

我正在使用 Python/Keras/TensorFlow。

最佳答案

也许 masking在模型的顶层可能会有所帮助。

For each timestep in the input tensor (dimension #1 in the tensor), if all values in the input tensor at that timestep are equal to mask_value, then the timestep will be masked (skipped) in all downstream layers (as long as they support masking).

关于python - 处理 RNN/LSTM 中的缺失数据(时间序列),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43680456/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com