gpt4 book ai didi

python-3.x - 从一些外部 tf-idf 矩阵和术语列表中使用 gensim 训练 LDA 模型

转载 作者:行者123 更新时间:2023-12-05 06:44:48 25 4
gpt4 key购买 nike

我已经有了一个 tf-idf 矩阵,其中行表示术语,列表示文档。现在我想用给定的术语文档矩阵训练 LDA 模型。第一步似乎是使用 gensim.matutils.Dense2Corpus 将矩阵转换为语料库格式。但是如何构造id2word参数呢?我有术语列表 (#terms==#rows),但我不知道字典的格式,所以我无法从 gensim.corpora.Dictionary.load_from_text 等函数构建字典。有什么建议么?谢谢。

最佳答案

id2word 必须将每个 id(整数)映射到 term(字符串)。

也就是说,它必须支持id2word[123] == 'koala'

普通的 Python dict 是最简单的选择。

关于python-3.x - 从一些外部 tf-idf 矩阵和术语列表中使用 gensim 训练 LDA 模型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27177721/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com