- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
对于句子分析任务,我想获取与句子关联的 POS 标签序列并将其提供给我的模型,就好像 POS 标签是单词一样。
我使用 GloVe 来表示句子中的每个单词,并使用 SpaCy 来生成 POS 标签。然而,GloVe 嵌入对于 POS 标签没有多大意义。所以我必须以某种方式为每个 POS 标签创建嵌入。为 POS 标签创建嵌入的最佳方法是什么,以便我可以像输入句子一样将 POS 序列输入到我的模型中?谁能指出如何在 Python 中使用 GloVe 执行此操作的代码示例吗?
添加了上下文
我的任务是根据句子对的相似性(相似含义与不同含义)对句子对进行二元分类。
我想使用 POS 标签作为单词,以便 POS 标签作为额外的信息来比较句子。我当前的模型不使用 LSTM 作为预测序列的方法。
最佳答案
大多数词嵌入模型仍然依赖于一个基本假设,即词的含义是由其使用上下文推断出来的。例如,使用skipgram或连续词袋公式学习word2vec嵌入隐含地假设了一个模型,其中单词的表示向量基于与目标单词共同出现的上下文单词,特别是通过学习创建最适合的嵌入解决区分上下文同时出现的单词对和随机单词对的分类任务(所谓的负采样)。
但是,如果输入更改为离散标签(POS 标签)序列,则此假设似乎不需要保持准确或合理。词性标签具有指定的含义,该含义并不是由其他词性标签包围的上下文真正诱导出来的,因此,在将 POS 标签视为词性标签时,用于生成词嵌入的标准学习任务不太可能起作用。来自较小词汇量的单词。
您的情况的整体句子分析任务是什么?
在问题随手头的学习任务更新后添加。
假设您可以为每个句子示例创建 POS 输入向量。如果可能存在 N 个不同的 POS 标签,则意味着您的输入将由来自词嵌入的一个向量和另一个长度为 N 的向量组成,其中组件 i
中的值表示输入句子中的术语数量拥有 POS 标签 P_i
。
例如,假设唯一可能的 POS 标签是“文章”、“名词”和“动词”,并且您有一个带有 [“文章”、“名词”、“动词”、“名词”] 的句子。然后它会转换为 [1, 2, 1]
,并且您可能想根据句子的长度对其进行标准化。我们将第 1 句的输入称为 pos1
,将第 2 句的输入称为 pos2
。
我们将句子 1 的词嵌入向量输入称为 sentence1
。 sentence1
将通过从单独的源(例如预训练的 word2vec 模型或 fastText 或 GloVe)查找每个单词嵌入并将它们相加(使用连续的单词包)来计算。 sentence2
也是如此。
假设您的批量训练数据已被处理为这些向量格式,因此给定的单个输入将是向量的 4 元组:句子 1 的查找 CBOW 嵌入向量,句子 2 的查找 CBOW 嵌入向量,以及计算出句子 1 的 POS 标签的离散表示向量,句子 2 的离散表示向量也相同。
可以根据此数据工作的模型可能如下所示:
from keras.engine.topology import Input
from keras.layers import Concatenate
from keras.layers.core import Activation, Dense
from keras.models import Model
sentence1 = Input(shape=word_embedding_shape)
sentence2 = Input(shape=word_embedding_shape)
pos1 = Input(shape=pos_vector_shape)
pos2 = Input(shape=pos_vector_shape)
# Note: just choosing 128 as an embedding space dimension or intermediate
# layer size... in your real case, you'd choose these shape params
# based on what you want to model or experiment with. They don't mean
# anything here.
sentence1_branch = Dense(128)(sentence1)
sentence1_branch = Activation('relu')(sentence1_branch)
# ... do whatever other sentence1-only stuff
sentence2_branch = Dense(128)(sentence2)
sentence2_branch = Activation('relu')(sentence2_branch)
# ... do whatever other sentence2-only stuff
pos1_embedding = Dense(128)(pos1)
pos1_branch = Activation('relu')(pos1_embedding)
# ... do whatever other pos1-only stuff
pos2_embedding = Dense(128)(pos2)
pos2_branch = Activation('relu')(pos2_embedding)
# ... do whatever other pos2-only stuff
unified = Concatenate([sentence1_branch, sentence2_branch,
pos1_branch, pos2_branch])
# ... do dense layers, whatever, to the concatenated intermediate
# representations
# finally boil it down to whatever final prediction task you are using,
# whether it is predicting a sentence similarity score (Dense(1)),
# or predicting a binary label that indicates whether the sentence
# pairs are similar or not (Dense(2) then followed by softmax activation,
# or Dense(1) followed by some type of probability activation like sigmoid).
# Assume your data is binary labeled for similar sentences...
unified = Activation('softmax')(Dense(2)(unified))
unified.compile(loss='binary_crossentropy', other parameters)
# Do training to learn the weights...
# A separate model that will just produce the embedding output
# from a POS input vector, relying on weights learned from the
# training process.
pos_embedding_model = Model(inputs=[pos1], outputs=[pos1_embedding])
关于python-3.x - 如何为 POS 标签生成 GloVe 嵌入? Python,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49804717/
我正在尝试使用以下 keytool 命令为我的应用程序生成 keystore : keytool -genkey -alias tomcat -keystore tomcat.keystore -ke
编辑:在西里尔正确解决问题后,我注意到只需将生成轴的函数放在用于生成标签的函数下面就可以解决问题。 我几乎读完了 O'Reilly 书中关于 D3.js 的教程,并在倒数第二页上制作了散点图,但是当添
虽然使用 GraphiQL 效果很好,但我的老板要求我实现一个用户界面,用户可以在其中通过 UI 元素(例如复选框、映射关系)检查呈现给他们的元素并获取数据,这样做将为该人生成 graphql 输入,
我尝试在 Netbean 6.8 中使用 ws-import 生成 Java 类。我想重新生成 jax-ws,因为在 ebay.api.paypalapi 包中发现了一个错误(我认为该错误是由于 Pa
我有一个 perl 脚本,它获取系统日期并将该日期写入文件名。 系统日期被分配给 TRH1 变量,然后它被设置为一个文件名。 $TRH1 =`date + %Y%m%d%H%M`; print "TR
我是 Haskell 的新手,需要帮助。我正在尝试构建一种必须具有某种唯一性的新数据类型,因此我决定使用 UUID 作为唯一标识符: data MyType = MyType { uuid ::
我制作了一个脚本,它可以根据 Mysql 数据库中的一些表生成 XML。 该脚本在 PHP 中运行。 public function getRawMaterials($apiKey, $format
所以这是我的项目中的一个问题。 In this task, we will use OpenSSL to generate digital signatures. Please prepare a f
我在 SAS LIFEREG 中有一个加速故障时间模型,我想绘制它。因为 SAS 在绘图方面非常糟糕,我想实际重新生成 R 中曲线的数据并将它们绘制在那里。 SAS 提出了一个尺度(在指数分布固定为
我正在为 Django 后端制作一个样板,并且我需要能够使它到达下一个下载它的人显然无法访问我的 secret key 的地方,或者拥有不同的 key 。我一直在研究一些选项,并在这个过程中进行了实验
我正在创建一个生成采购订单的应用程序。我可以根据用户输入的详细信息创建文本文件。我想生成一个看起来比普通文本文件好得多的 Excel。有没有可以在我的应用程序中使用的开源库? 最佳答案 目前还没有任何
我正在尝试使用 ScalaCheck 为 BST 创建一个 Gen,但是当我调用 .sample 方法时,它给了我 java.lang.NullPointerException。我哪里错了? seal
已关闭。此问题需要 debugging details 。目前不接受答案。 编辑问题以包含 desired behavior, a specific problem or error, and the
我尝试编写一些代码,例如(在verilog中): parameter N = 128; if (encoder_in[0] == 1) begin 23 binary_out = 1;
我正忙于在 Grails 项目中进行从 MySQL 到 Postgres 的相当复杂的数据迁移。 我正在使用 GORM 在 PostGres 中生成模式,然后执行 MySQL -> mysqldump
如何使用纯 XSLT 生成 UUID?基本上是寻找一种使用 XSLT 创建独特序列的方法。该序列可以是任意长度。 我正在使用 XSLT 2.0。 最佳答案 这是一个good example 。基本上,
我尝试安装.app文件,但是当我安装并单击“同步”(在iTunes中)时,我开始在设备上开始安装,然后停止,这是一个问题,我不知道在哪里,但我看到了我无法解决的奇怪的事情: 最佳答案 似乎您没有在Xc
自从我生成 JavaDocs 以来已经有一段时间了,我确信这些选项在过去 10 年左右的时间里已经得到了改进。 我能否得到一些有关生成器的建议,该生成器将输出类似于 .Net 文档结构的 JavaDo
我想学习如何生成 PDF,我不想使用任何第三方工具,我想自己用代码创建它。到目前为止,我所看到的唯一示例是我通过在第 3 方 dll 上打开反射器查看的代码,以查看发生了什么。不幸的是,到目前为止我看
我正在从 Epplus 库生成 excel 条形图。 这是我成功生成的。 我的 table 是这样的 Mumbai Delhi Financial D
我是一名优秀的程序员,十分优秀!