gpt4 book ai didi

python - 如何在 Gensim 中获取上下文单词列表

转载 作者:太空宇宙 更新时间:2023-11-03 21:24:26 25 4
gpt4 key购买 nike

如何从预训练的 fasttext 模型中获取最常见的上下文单词?

例如:对于单词“足球”和语料库 ["I like playing football with my friends"]

获取上下文单词列表:['playing', 'with','my','like']

我尝试使用 model_wiki = gensim.models.KeyedVectors.load_word2vec_format("wiki.ru.vec")
model.most_similar("блок")

但我并不满意

最佳答案

普通模型不保留原始语料库中的任何此类共现统计数据。它只有经过训练的结果:每个单词的向量。

因此,most_similar() 向量的排名列表(这并不完全是一起出现的单词,但与之密切相关)是您从该文件中获得的最佳结果。

只有返回原始训练语料库才能准确地满足您的要求。

关于python - 如何在 Gensim 中获取上下文单词列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53955958/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com