gpt4 book ai didi

python - 时间序列间隙填充的想法(使用统计学习?)

转载 作者:行者123 更新时间:2023-11-30 09:30:53 24 4
gpt4 key购买 nike

我正在寻找时间序列问题的一些输入。

我拥有的是 2008-2018 年的土地使用数据。每行看起来像这样,其中每个值代表连续一年中特定单元格的土地使用情况:

[1.0, 2.0, 1.0, 3.0, 3.0, 3.0, 3.0, 3.0, 3.0, 3.0, 3.0]

每个数字代表一种土地利用类型。

但是有时它看起来像这样:

[1.0, 2.0, 1.0, 3.0, 3.0, 3.0, NaN, 3.0, 3.0, 3.0, 3.0]

有时它看起来像这样:

[1.0, 2.0, 1.0, 3.0, 3.0, 3.0, 8.0, 3.0, 3.0, 3.0, 3.0]

3.0级=茂密的森林,8.0 级 = 建成区

在 NaN 和不一致的土地利用转变的情况下,我都想使用统计学习之类的方法来填充和纠正我的观察结果,其中土地利用类型可能基于以前和过去的土地利用而发生。

现在,我已经建立了一个评分方案,对以前的土地利用和过去的土地利用类型进行评分(越接近缺失的权重越重)。然后填写得分最高的土地利用类型来弥补缺失/不一致的值。我仍在研究如何测试该方案的性能。

无论如何,评分方案有点随意,我想为我可以尝试的其他想法提供一些意见。我对 Python 很熟悉,但在机器学习和插补方面仍然是初学者。

非常感谢您的想法!

最佳答案

最好的方法可能不是使用统计学习

  • 根据最后一个值进行估算
  • 用最后一个和后续非缺失值之间的平均值进行插补
  • 用滚动窗口中的平均值进行插补

或者您可以尝试一些线性回归或基于时间序列的建模(arima,LSTM,...),但同样,我不确定这是最好的方法。您应该尝试根据经验评估结果。

关于python - 时间序列间隙填充的想法(使用统计学习?),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58411123/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com