gpt4 book ai didi

python - 了解使用 "gensim.corpora.Dictionary(TEXT)"后单词如何存储在 gensim 语料库中

转载 作者:太空宇宙 更新时间:2023-11-04 02:29:35 27 4
gpt4 key购买 nike

在将文本文档列表转换为语料库字典,然后使用以下方法将其转换为词袋模型之后:

dictionary = gensim.corpora.Dictionary(docs) # docs is a list of text documents
corpus = [dictionary.doc2bow(doc) for doc in docs]

我们可以使用以下方法找出特定单词在字典中的索引值:

dictionary.doc2idx(["righteous","height"])

有什么办法可以找到字典中特定索引处存储的单词吗?

最佳答案

长话短说:

dictionary.get(index_of_word)

例子:

import gensim

docs=[['hello', 'world'],['i','am', 'groot']]

dictionary = gensim.corpora.Dictionary(docs) # docs is a list of text documents
corpus = [dictionary.doc2bow(doc) for doc in docs]

print(dictionary.get(0))
print(dictionary.get(3))

输出:

hello
groot

希望对您有所帮助!

关于python - 了解使用 "gensim.corpora.Dictionary(TEXT)"后单词如何存储在 gensim 语料库中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49527668/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com