gpt4 book ai didi

python - Gensim Doc2vec – KeyError : "tag not seen in training corpus/invalid"

转载 作者:太空宇宙 更新时间:2023-11-03 21:26:45 27 4
gpt4 key购买 nike

我正在使用 gensim 的 Doc2vec 从新闻文章中学习特征。我可以成功地训练我的文档。但是,我很难从模型中检索文档向量以进行进一步处理。

示例代码(直接取from gensim's documentation):

from gensim.models.doc2vec import Doc2Vec, TaggedDocument
from gensim.test.utils import common_texts

documents = [TaggedDocument((doc), [i]) for i, doc in enumerate(common_texts)]
model = Doc2Vec(documents, vector_size=5, window=2, min_count=1, workers=4)

这可以正确训练,没有错误。

如果我尝试直接使用 model.docvecs 或像这样迭代它:

for vector in model.docvecs:
print(vector)

我收到此错误:

KeyError: "tag '9' not seen in training corpus/invalid"

这是什么原因以及如何解决这个问题?

最佳答案

解决了...

我需要使用

model.docvecs.doctag_syn0 (即将弃用)

model.docvecs.vectors_docs

关于python - Gensim Doc2vec – KeyError : "tag not seen in training corpus/invalid",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53796806/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com