gpt4 book ai didi

gensim - 有什么方法可以从doc2vec模型中获取词汇量吗?

转载 作者:行者123 更新时间:2023-12-04 17:07:38 29 4
gpt4 key购买 nike

我正在使用gensim doc2vec。我想知道是否有任何有效的方法来了解doc2vec的词汇量。一种粗略的方法是计算单词总数,但是如果数据量很大(1GB或更多),那么这将不是一种有效的方法。

最佳答案

如果model是您训练有素的Doc2Vec模型,则可以从以下位置获取应用min_count之后尚存的词汇表中的唯一单词标记数:

len(model.wv.vocab)

可从以下位置获得经过培训的文档标签的数量:
len(model.docvecs)

关于gensim - 有什么方法可以从doc2vec模型中获取词汇量吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41607976/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com