作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
有谁知道如何将带有从 StarSpace 生成的嵌入的 tsv 文件加载到 Gensim 中? Gensim 文档似乎经常使用 Word2Vec,但我找不到相关的答案。
谢谢,
阿穆利亚
最佳答案
您可以使用来自经过训练的 StarSpace 模型的 tsv 文件,并将其转换为 Gensim 能够导入的 Word2Vec 格式的 txt 文件。
新 txt 文件的第一行应说明行数(确保首先删除文件末尾的所有空行)和 tsv 文件的向量大小(维度)。文件的其余部分看起来与原始 tsv 文件相同,但使用空格而不是制表符。
转换文件的 Python 代码如下所示:
with open('path/to/starspace-model.tsv', 'r') as inp, open('path/to/word2vec-format.txt', 'w') as outp:
line_count = '...' # line count of the tsv file (as string)
dimensions = '...' # vector size (as string)
outp.write(' '.join([line_count, dimensions]) + '\n')
for line in inp:
words = line.strip().split()
outp.write(' '.join(words) + '\n')
from gensim.models import KeyedVectors
word_vectors = KeyedVectors.load_word2vec_format('path/to/word2vec-format.txt', binary=False)
关于gensim - 如何加载从 StarSpace 生成的嵌入(在 tsv 文件中),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49088689/
有谁知道如何将带有从 StarSpace 生成的嵌入的 tsv 文件加载到 Gensim 中? Gensim 文档似乎经常使用 Word2Vec,但我找不到相关的答案。 谢谢, 阿穆利亚 最佳答案 您
我正在尝试在 google colab 中运行此代码。 %%bash ./Starspace/starspace train \ -trainFile "data/prepared_train.tsv
我是一名优秀的程序员,十分优秀!