gpt4 book ai didi

machine-learning - 如何获得未知单词的随机word2vec向量?

转载 作者:行者123 更新时间:2023-11-30 09:52:54 25 4
gpt4 key购买 nike

我在训练数据上训练word2vec,但是测试数据中有一些单词不在训练数据中,那么如何生成与原始数据分布或数字范围匹配的单词向量?

最佳答案

您可以获取词汇表中不常见单词的列表,并对它们进行平均,以获得未知单词的近似单词向量。

或者

假设您的目标未知单词是 w 且其在上下文 c-2 c-1 w c1 c2 中,其中 c-2c-1c1c2 是上下文单词。您可以将所有上下文单词的嵌入平均值作为未知单词的良好近似值。

关于machine-learning - 如何获得未知单词的随机word2vec向量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41517969/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com