gpt4 book ai didi

nlp - 如何将词嵌入和 pos 嵌入结合在一起来构建分类器

转载 作者:行者123 更新时间:2023-12-04 00:30:43 28 4
gpt4 key购买 nike

你知道的 POS 就像 'NP'、'VERB'。如何将这些功能结合到 word2vec 中?

就像下面的向量一样?

keyword    V1         V2          V3         V4            V5         V6   
corruption 0.07397 0.290874 -0.170812 0.085428 'VERB' 'NP'
people ..............................................................
budget ...........................................................

最佳答案

第一个简单的解决方案是简单地将嵌入向量与一个表示 POS 标签的热编码向量连接起来。

然而,如果你想做一些更有趣的事情,你应该找到一个合适的方法来加权这些不同的功能。

例如,您可以使用 XGboost:给定一组未标准化的特征(在您的情况下为嵌入 + POS),根据特定任务为每个特征分配权重。

作为替代方案,您可以使用神经网络将这些特征组合成一个独特的、有意义的隐藏表示。

假设每个单词的上下文在您的任务中都很重要,您可以执行以下操作:

  • 计算词嵌入(N 维)
  • 计算 pos(1 个热编码向量)
  • 在 pos 上运行 LSTM 或类似的循环层。
  • 对于每个词,创建一个表示,由其词嵌入与 LSTM 层的相应输出连接而成。
  • 使用全连接层创建一致的隐藏表示。

  • 附言请注意,循环层的使用不是强制性的,您也可以尝试将 pos 和 embedding 直接连接起来,然后应用全连接层。

    关于nlp - 如何将词嵌入和 pos 嵌入结合在一起来构建分类器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51537441/

    28 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com