gpt4 book ai didi

convolution - CNN : initializing unknown words from word2vec

转载 作者:行者123 更新时间:2023-12-01 10:38:09 24 4
gpt4 key购买 nike

我看到了这些幻灯片,Kim 关于 CNN 使用 word2vec 的演示: http://www.people.fas.harvard.edu/~yoonkim/data/Kim_EMNLP_2014_slides.pdf

在幻灯片 20 上,第四个要点是:

Words not in word2vec are initialized randomly from U[−a, a] 
where a is chosen such that the unknown words have the
same variance as words already in word2vec.

现在我想知道如何计算“a”以及如何计算完全未知单词的整个向量。

最佳答案

根据 answer通过 Mikolov 自己,你可以根据不常用词描述的空间来初始化向量。在他的回答中,他提到您应该对不常用的词进行平均,并以这种方式构建未知标记。

顺着这个思路,我认为a指的是不常用词空间的半径。你可以做的是得到不常用词的质心C(通过平均值),计算不常用向量空间Q 2*a strong>,并通过位于 Q 内的均匀分布样本生成随机向量 u

关于convolution - CNN : initializing unknown words from word2vec,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32277377/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com