gpt4 book ai didi

python - 日期时间对像 one-hot-encoding 这样的 one-hot-vector 进行编码或其他类似的东西是否有意义

转载 作者:行者123 更新时间:2023-11-30 09:48:53 24 4
gpt4 key购买 nike

我是机器学习和深度学习的新手。我想解决时间序列问题,该问题每秒都有数据。另外,我最近一直在研究word2vector和时间序列数据。有一天,我想到了一个想法,将日期时间等序列数据转换为 one-hot 编码?

    time
2017-11-01 00:00:01
2017-11-01 00:00:02
2017-11-01 00:00:03
2017-11-01 00:00:04
.
.
.

我的想法有一些局限性,如下所示,

  • 学习维度过高(1day = 60* 60 * 24 = 86400(s))
  • 无限时间 - 时间每时每刻都会生成,即使是现在
  • 秒之间的差异太小,无法学习

我希望您确定我上面所说的有关限制的内容。另外,我想让你给我一些想法,将时间序列数据开发为机器学习和深度学习的单热向量? +你觉得这个想法怎么样?

最佳答案

不,每秒一次的热编码没有意义。正如您所提到的,特征向量是高维的。更糟糕的是:特征向量极其稀疏。

相反,您可以:

  • 按天分组:一年 365 个功能。
  • 添加诸如 is_weekdayis_workdayis_saturdayis_morningis_afternoon 等功能, ... - 这取决于您的问题中最重要的是什么!
  • 也许您还可以添加一项 Unix 时间功能,但请进行标准化(均值减法、除以预期值范围)。

关于python - 日期时间对像 one-hot-encoding 这样的 one-hot-vector 进行编码或其他类似的东西是否有意义,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48534636/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com