python - 举例说明 : how embedding layers in keras works-6ren

python - 举例说明 : how embedding layers in keras works

转载作者：行者123 更新时间：2023-11-30 08:21:56

25

4

我不明白Keras的Embedding层。虽然有很多文章解释了，但我还是很困惑。例如，下面的代码来自imdb情感分析:

top_words = 5000
max_review_length = 500
embedding_vecor_length = 32    

model = Sequential()
model.add(Embedding(top_words, embedding_vecor_length, input_length=max_review_length))
model.add(LSTM(100))
model.add(Dense(1, activation='sigmoid'))
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])
print(model.summary())
model.fit(X_train, y_train, nb_epoch=3, batch_size=64)

在这段代码中，嵌入层到底在做什么？嵌入层的输出是什么？如果有人可以用一些例子来解释它，那就太好了!

最佳答案

嵌入层从输入单词中创建嵌入向量(我自己仍然不懂数学)，类似于word2vec或pre-calculated glove就可以了。

在讨论您的代码之前，让我们先举一个简短的示例。

texts = ['This is a text', 'This is not a text']

首先，我们将这些句子转换为整数向量，其中每个单词都是分配给字典中单词的数字，向量的顺序创建单词的序列。

from keras.preprocessing.text import Tokenizer
from keras.preprocessing.sequence import pad_sequences 
from keras.utils import to_categorical

max_review_length = 6  # maximum length of the sentence
embedding_vector_length = 3
top_words = 10

# num_words is the number of unique words in the sequence, if there's more top count words are taken
tokenizer = Tokenizer(top_words)
tokenizer.fit_on_texts(texts)
sequences = tokenizer.texts_to_sequences(texts)
word_index = tokenizer.word_index
input_dim = len(word_index) + 1
print('Found %s unique tokens.' % len(word_index))

# max_review_length is the maximum length of the input text so that we can create vector [... 0,0,1,3,50] where 1,3,50 are individual words
data = pad_sequences(sequences, max_review_length)

print('Shape of data tensor:', data.shape)
print(data)

[Out:] 
'This is a text' --> [0 0 1 2 3 4]
'This is not a text' --> [0 1 2 5 3 4]

现在您可以将这些输入到嵌入层中。

from keras.models import Sequential
from keras.layers import Embedding

model = Sequential()
model.add(Embedding(top_words, embedding_vector_length, input_length=max_review_length, mask_zero=True))
model.compile(optimizer='adam', loss='categorical_crossentropy')
output_array = model.predict(data)

output_array包含大小为 (2, 6, 3) 的数组:在我的例子中，有 2 个输入评论或句子，6 是每个评论中的最大单词数 ( max_review_length )，3 是 embedding_vector_length 。例如

array([[[-0.01494285, -0.007915  ,  0.01764857],
    [-0.01494285, -0.007915  ,  0.01764857],
    [-0.03019481, -0.02910612,  0.03518577],
    [-0.0046863 ,  0.04763055, -0.02629668],
    [ 0.02297204,  0.02146662,  0.03114786],
    [ 0.01634104,  0.02296363, -0.02348827]],

   [[-0.01494285, -0.007915  ,  0.01764857],
    [-0.03019481, -0.02910612,  0.03518577],
    [-0.0046863 ,  0.04763055, -0.02629668],
    [-0.01736645, -0.03719328,  0.02757809],
    [ 0.02297204,  0.02146662,  0.03114786],
    [ 0.01634104,  0.02296363, -0.02348827]]], dtype=float32)

在您的情况下，您有一个包含 5000 个单词的列表，它可以创建最多 500 个单词的评论(更多单词将被修剪)，并将这 500 个单词中的每个单词转换为大小为 32 的向量。

您可以通过运行以下命令获得单词索引和嵌入向量之间的映射:

model.layers[0].get_weights()

在下面的例子中top_words是 10，所以我们有 10 个单词的映射，您可以看到 0、1、2、3、4 和 5 的映射等于 output_array如上所述。

[array([[-0.01494285, -0.007915  ,  0.01764857],
    [-0.03019481, -0.02910612,  0.03518577],
    [-0.0046863 ,  0.04763055, -0.02629668],
    [ 0.02297204,  0.02146662,  0.03114786],
    [ 0.01634104,  0.02296363, -0.02348827],
    [-0.01736645, -0.03719328,  0.02757809],
    [ 0.0100757 , -0.03956784,  0.03794377],
    [-0.02672029, -0.00879055, -0.039394  ],
    [-0.00949502, -0.02805768, -0.04179233],
    [ 0.0180716 ,  0.03622523,  0.02232374]], dtype=float32)]

如所述:https://stats.stackexchange.com/questions/270546/how-does-keras-embedding-layer-work这些向量是随机启动的，并由网络优化器进行优化，就像网络的任何其他参数一样。

关于python - 举例说明 : how embedding layers in keras works，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/45649520/

25

4

0

文章推荐： java - RMI 和普通对象序列化之间有区别吗？

文章推荐： javascript - undefined variable 的clearInterval问题原因

javascript - 如何根据 JS 中的条件传递算术运算符？对 'add' 说 +，对 'times' 说 *
我正在编写一个 JS 程序，我有一个条件可以根据输入进行一些算术运算。如果我遇到操作类型为“add”，我需要将两个值相加；如果我得到“times”作为我的运算符值，我需要相乘。我尝试使用基本的 if
macos - 是否值得在只读文档类中对 autosavesInPlace 说"is"？
我正在编写一个仅作为查看器的应用程序 - 无需创建、无需编辑、无需保存。显然，那么，不会有自动保存，但是还有什么其他东西可以从 autosavesInPlace 返回 YES 改变世界，从而对观看者
Azure 说 "Unsupported Token"
Azure 开始出现以下错误: Unsupported token. Unable to initialize the authorization context. 每当我尝试更改我的应用程序时，我都
java - out.println 说 out 无法解析
当我编写 out.println() 时，Eclipse 提示 out 无法解析。我导入了 java.io.* 和其他 servlet 包。最佳答案只是在黑暗中拍摄，我认为这就是您正在寻找的出路
Azure 说 "Unsupported Token"
Azure 开始出现以下错误: Unsupported token. Unable to initialize the authorization context. 每当我尝试更改我的应用程序时，我都
jQuery，使用 !说 "not selected"
是否可以执行类似的操作来检查 radio 表单是否未选中: if !($(this).find("input:checked")) {} 正确的语法是什么？最佳答案试试这个: $(this).fi
MySQL 说 'SYSDATETIME' 不存在
我正在尝试从表中选择行，其中 date 列值等于澳大利亚悉尼的当前日期 (UTC+10h)。服务器位于悉尼，因此我想使用 SYSDATETIME()。这是我的查询: SELECT * FROM dat
javascript - 说 javascript 变量指向一个值是否正确？
我听说 JavaScript 实际上并不像其他语言那样“指向”内存中的值(或对象，因为在 JS 中一切都是对象)。相反，JS 变量引用内存中的其他值/对象。这是真的？指向和引用之间的语义区别是什么？
Java 说 FileNotFoundException 但文件存在
我的计算机科学类(class)有一项作业，其中要求读取包含多个测试分数的文件，并要求我对它们进行求和并求平均值。虽然求和和求平均值很容易，但我在读取文件时遇到问题。老师说用这个语法 Scanner s
Java 说 XML 文档格式不正确
Java 的 XML 解析器似乎认为我的 XML 文档在根元素之后的格式不正确。但我已经用几种工具验证了它，但他们都不同意。这可能是我的代码错误，而不是文档本身的错误。如果你们能给我提供任何帮助，我将
c++ - 说 xvalues 具有身份并且是可移动的是正确的吗？
根据这份文件: http://www.stroustrup.com/terminology.pdf l 值具有同一性且不可移动。公关值是可移动的，但没有身份。 x 值具有同一性并且是可移动的。关于
mongodb - 说 MongoDB 在其写操作级别上是原子的是什么意思？
这个问题在这里已经有了答案: What does "atomic" mean in programming? (7 个答案) 关闭 5 年前。我正在阅读 MongoDB 的 documentati
php - 说 2 个数组中有多少项相同？
在 PHP 和 MySQL 中有没有一种方法能够比较 2 个不同的数组(列表)变量并说出有多少项是相同的例如， $array1 = "hello, bye, google, laptop, yes"
java - 说 int 枚举模式是编译时常量是什么意思？
本文来自 Effective Java Programs that use the int enum pattern are brittle. Because int enums are compil
c++ - 说 C++ 是一种部分类型安全的语言是否准确？
C++ 中有一些特性是类型安全的，而另一些则不是。 C++ 类型安全示例: char c = 'a'; int *p = &c; // this is not allowed (compiler
Java 说 FileNotFoundException 但文件存在
我有一个 CS 课的作业，它说要读取一个包含多个测试分数的文件，并要求我对它们求和并取平均值。虽然求和和平均很容易，但我在读取文件时遇到了问题。老师说要用这个语法 Scanner scores = n
Pydev 说， "Unresolved import"错误
嗯.. 有时，PyDev 会说“ Unresolved 导入错误”。在我的环境中 Python2.6.6 Eclipse3.7 PyDev2.2.2 错误是。 > Unresolved import
ios8 - AFNetworking 说 "cannot parse response"
我正在向服务器发送请求，服务器正在处理请求并做出响应。但是在我的应用程序中，我收到了: Error Domain=NSURLErrorDomain Code=-1017 "cannot parse r
javascript - 说 : "JavaScript + AJAX"? 是多余的吗
在我最近的一次讨论中，有人告诉我这样说是不正确的，因为 Ajax 已经是 Javascript。上下文: “我如何在网页中 blablababal，这样它就不必刷新页面” 我的回答: “使用 Jav
ffmpeg 说 : "option framerate not found"
下午好。我一直在尝试使用 ffmpeg 将 .mpeg 拆分为一系列 .jpeg 图像。请注意，这是指定 here 的逆问题，但我面临的问题与该线程的作者面临的问题不同。具体来说，我已经在我的 f

首页

博学

6Ren·AI

商城

python - 举例说明 : how embedding layers in keras works