gpt4 book ai didi

python - 为什么在 gensim word2vec 中创建多个模型文件?

转载 作者:行者123 更新时间:2023-11-30 09:15:53 25 4
gpt4 key购买 nike

当我尝试创建 word2vec 模型(具有负采样的skipgram)时,我收到了 3 个文件作为输出,如下所示。

word2vec (File)
word2vec.syn1nef.npy (NPY file)
word2vec.wv.syn0.npy (NPY file)

我只是担心为什么会发生这种情况,因为我之前在 word2vec 中的测试示例我只收到了一个模型(没有 npy 文件)。

请帮助我。

最佳答案

具有较大内部向量数组的模型无法通过 Python“pickle”保存到单个文件,因此超过特定阈值时,gensim save() 方法会将辅助数组存储在单独的文件中文件,使用更高效的 numpy 数组原始格式(.npy 格式)。

您仍然可以通过指定根模型文件名来load()模型;当需要辅助数组时,加载代码将找到辅助文件 - 只要它们保留在根文件旁边。因此,当将模型移动到其他地方时,请确保将具有相同根文件名的所有文件保存在一起。

关于python - 为什么在 gensim word2vec 中创建多个模型文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56063312/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com