gpt4 book ai didi

python - LSTM - 处理一个日期中的多行

转载 作者:太空宇宙 更新时间:2023-11-03 11:57:50 28 4
gpt4 key购买 nike

我有大约 6 个月的时间序列数据,其中包含“实体”(自由文本)和“成本”列。我的目标是根据日期和实体预测“成本”。我已经使用词嵌入和词计数来将文本特征合并到 LSTM 中。也有可能:

  • 一个日期没有记录
  • 并非所有实体都存在于一个日期

我对数据的表示感到困惑。我如何在 LSTM 中嵌入单个日期的多行以及 LSTM 将如何缓解新实体?

下面是数据样本。

enter image description here

我已将我的输入转换为向量:

enter image description here

请帮助我。

最佳答案

我可能不太理解你的问题。但是正如我在图片中看到的那样,您每天有不止一条记录,这是您的主要问题。解决这个问题并不难。请注意,您可以将张量 作为您的X 传递,并将所有多条记录绑定(bind)到一个矩阵中。

例如,您的数据的简单张量将是这样的:

date :                        [Entity vector, Weight vector, …, Cost vector]
----------------------------------------------------------------------------
24/05/2019: [[A, B, C, D], [18.1, 22, 36, 46], …, [25, 24, 23, 50]]
25/05/2019: [[A, B, C], [43, 44, 35], …, [24, 0, 0]]
27/05/2019: [[A, B, C, D, F], [34, 46, 31, 27, 60], …, [27, 24, 23, 50, 35]]

注意:可能需要让所有向量的长度相同(对于矩阵乘法)。然后你可以使用“Padding”。 (这意味着只需将 0-1 用于缺少的实体。您有两种可能的场景:

1) 如果您有有限实体,例如只有AF。您只需为非永久值添加 -1。不需要第一个向量,因为它们是固定的,例如 index 1 总是代表 A。填充后的最终张量将是这样的:

date : "indexes are [A, B, C, D, E, F]" [Weight vector, …, Cost vector]
-----------------------------------------------------------------------
24/05/2019: [[18.1, 22, 36, 46, -1, -1], …, [25, 24, 23, 50, -1, -1]]
25/05/2019: [[43, 44, 35, -1, -1, -1], …, [24, 0, 0, -1, -1, -1]]
27/05/2019: [[34, 46, 31, 27, 60, -1], …, [27, 24, 23, 50, 35, -1]]

2) 如果您有无限实体,我的意思是如果您的实体可以是任何东西。那么你必须保留第一个向量并将所有向量填充到最大长度向量。在这种情况下,填充后最终张量将像这样(假设 27/05/2019 具有最大长度):

date :                            [Entity vector, Weight vector, …, Cost vector]
--------------------------------------------------------------------------------
24/05/2019: [[A, B, C, D, -1], [18.1, 22, 36, 46, -1], …, [25, 24, 23, 50, -1]]
25/05/2019: [[A, B, C, -1, -1], [43, 44, 35, -1, -1], …, [24, 0, 0, -1, -1]]
27/05/2019: [[A, B, C, D, F], [34, 46, 31, 27, 60], …, [27, 24, 23, 50, 35]]

TIP: if your entities are more than one word, then you can use a hash to transfer them to just one number. (I don't recommend using a series of word-embeddings for this! this is too heavy for this 6-moths-data LSTM model, and you won't get a good result out of it.


现在,您将这些向量输入 LSTM。在下图中,X0X1 以及……就是这些张量。 (而且你们很多人期望 hs 的第二天价格)。

enter image description here

关于python - LSTM - 处理一个日期中的多行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58449353/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com