gpt4 book ai didi

python - LDA Gensim Word -> 主题 ID 分布而不是主题 -> 单词分布

转载 作者:行者123 更新时间:2023-11-30 23:12:35 25 4
gpt4 key购买 nike

我正在尝试在我训练过的 lda 模型上实现主题平铺算法。对于该算法,我需要分配给未见过的文档中的单个单词的所有 ID。然后,我将计算给定单词最常见的主题 ID,并将其指定为该单词的模式。

我正在使用 gensim 库,因此很容易获得主题->单词分布,其中单词及其概率给出。但是,我如何获得“哪些主题被分配给一个世界”,即单词->主题分布。

Example:
s = "Banks are closed on Sunday"

Topic -> Word Dist from Gensim:
TopicTag -> Prob*Word
Topic 0 -> 0,3*Bank, 0,2*are
Topic 1 -> 0,2*closed, 0,1*Sunday
Topic 2 -> 0,4*Sunday, 0,3*on

What I want:
word -> TopicTag(Frequency that given word was assigned with the specified topic tag)
Banks -> Topic1(2), Topic2(2)
Closed -> Topic0(1),Topic1 (4)

另请注意,我对解析 Gensim 的主题 -> 单词分布结果不感兴趣,我有兴趣找到一种准确的方法,让我的模型将(众多)主题分配给将出现的每个单词一份看不见的文件。

提前致谢。

最佳答案

您可以从lda_model.get_lambda()获取单词主题权重矩阵。另请参阅此邮件列表线程:https://groups.google.com/d/msg/gensim/6N9-Y5KVQu0/soFqkEopMWgJ

关于python - LDA Gensim Word -> 主题 ID 分布而不是主题 -> 单词分布,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29751328/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com