gpt4 book ai didi

python-3.x - word2vec - 通过特定向量查找单词

转载 作者:行者123 更新时间:2023-12-02 00:59:15 24 4
gpt4 key购买 nike

我训练了一个 gensim Word2Vec 模型。假设我有一个特定的向量,我想找到它代表的词 - 最好的方法是什么?

含义,对于一个特定的向量:

vec = array([-0.00449447, -0.00310097,  0.02421786, ...], dtype=float32)

我想说一句话:

 'computer' = model.vec2word(vec)

最佳答案

词向量是通过迭代的、近似的过程生成的——所以不应该被认为是精确的(即使它们确实有精确的坐标),只是“在一定的公差范围内有用”。

因此,没有查找精确坐标的精确词。相反,在 gensim Word2Vec 和相关类中有 most_similar(),它给出了已知词最接近给定的已知词或向量坐标,在排名顺序,具有余弦相似性。因此,如果您刚刚训练(或加载)一个完整的 Word2Vec 模型到变量 model 中,您可以通过以下方式获得最接近向量的词:

vec = array([-0.00449447, -0.00310097,  0.02421786, ...], dtype=float32)
similars = model.wv.most_similar(positive=[vec])
print(similars)

如果您只想要单个最接近的单词,它会在 similars[0][0](排名靠前的元组的第一个位置)中。

关于python-3.x - word2vec - 通过特定向量查找单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51854220/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com