gpt4 book ai didi

pytorch - pytorch的嵌入层内部发生了什么“确切”的变化?

转载 作者:行者123 更新时间:2023-12-04 20:26:49 32 4
gpt4 key购买 nike

通过多次搜索和pytorch文档本身,我可以发现在嵌入层内部有一个查找表,用于存储嵌入向量。我无法理解的是:


在这一层的培训期间究竟发生了什么?
权重是多少,以及这些权重的梯度是如何计算的?
我的直觉是,至少应该有一个带有一些参数的函数,该函数会生成查找表的键。如果是这样,那功能是什么?


任何帮助,将不胜感激。谢谢。

最佳答案

这是一个很好的问题! PyTorch的嵌入层(Tensorflow也是如此)用作查找表,只是为每个输入(索引)检索嵌入。考虑以下情况,您有一个句子,其中每个单词都被标记。因此,句子中的每个单词都用唯一的整数(索引)表示。如果索引(单词)的列表是[1, 5, 9],并且您想要使用50维度向量(嵌入)对每个单词进行编码,则可以执行以下操作:

# The list of tokens
tokens = torch.tensor([0,5,9], dtype=torch.long)
# Define an embedding layer, where you know upfront that in total you
# have 10 distinct words, and you want each word to be encoded with
# a 50 dimensional vector
embedding = torch.nn.Embedding(num_embeddings=10, embedding_dim=50)
# Obtain the embeddings for each of the words in the sentence
embedded_words = embedding(tokens)

现在,回答您的问题:

在前进过程中,将以与Numpy的索引工作类似的方式获得句子中每个标记的值。因为在后端,这是一个微分运算,所以在向后遍历(训练)期间,Pytorch将为每个嵌入计算梯度并相应地重新调整它们。

权重是嵌入本身。词嵌入矩阵实际上是权重矩阵,将在训练过程中学习。

本身没有实际功能。正如我们上面所定义的,句子已经被标记化了(每个单词都由一个唯一的整数表示),我们可以为句子中的每个标记获得嵌入。


最后,正如我多次提到带有索引的示例一样,让我们​​尝试一下。
# Let us assume that we have a pre-trained embedding matrix
pretrained_embeddings = torch.rand(10, 50)
# We can initialize our embedding module from the embedding matrix
embedding = torch.nn.Embedding.from_pretrained(pretrained_embeddings)
# Some tokens
tokens = torch.tensor([0,5,9], dtype=torch.long)

# Token embeddings from the lookup table
lookup_embeddings = embedding(tokens)
# Token embeddings obtained with indexing
indexing_embeddings = pretrained_embeddings[tokens]
# Voila! They are the same
np.testing.assert_array_equal(lookup_embeddings.numpy(), indexing_embeddings.numpy())

关于pytorch - pytorch的嵌入层内部发生了什么“确切”的变化?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58718612/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com