gpt4 book ai didi

python - 在 gensim 中使用 freebase 向量

转载 作者:行者123 更新时间:2023-11-28 16:32:35 26 4
gpt4 key购买 nike

我正在尝试使用 Google 发布的 freebase 词嵌入,但我很难从 freebase 名称中获取单词。

model = gensim.models.Word2Vec.load_word2vec_format('freebase-vectors-skipgram1000.bin',binary=True)
model.vocab.keys()[:10]

Out[22]:
[u'/m/026tg5z',
u'/m/018jz8',
u'/m/04klsk',
u'/m/08gd39',
u'/m/0kt94',
u'/m/05mtf0t',
u'/m/05tjjb',
u'/m/01m3vn',
u'/m/0h7p35',
u'/m/03ggvg3']

有谁知道是否存在某种表格可以将 freebase 表示映射到它们所代表的词中?

问候,

和迪

最佳答案

有人实际上为我们所有人做了一件好事,并将 ID 映射到预训练模型中的名称。您可以下载那个模型here .

from gensim.models import Word2Vec
model = Word2Vec.load_word2vec_format('freebase-vectors-skipgram1000-en.bin.gz',
binary=True)

注意 .bin 之前的额外 -en。然后是一些示例词汇:

>>> list(model.vocab.keys())[:10] 
['/en/the_final_country', '/en/independent_curators_international',
'/en/coney_reyes', '/en/scalr', '/en/everyman_palace_theatre',
'/m/0g55w3s', '/en/waltershausen', '/en/river_frome_stroud',
'/en/grzegorz_turnau']

关于python - 在 gensim 中使用 freebase 向量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30480027/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com