gpt4 book ai didi

nlp - 关于 lda 推理

转载 作者:行者123 更新时间:2023-12-04 14:25:52 27 4
gpt4 key购买 nike

现在,我正在使用 MALLET 包中的 LDA 主题建模工具对我的文档进行一些主题检测。最初一切都很好,我从中得到了 20 个主题。但是,当我尝试使用该模型推断新文档时,结果有点莫名其妙。

例如,我故意在我手动创建的文档上运行我的模型,该文档只包含来自“FLU”主题之一的关键字,但我得到的主题分布对于每个主题都 <0.1。然后,我在已经采样的文档之一上尝试了同样的事情,其中​​一个主题的得分为 0.7。同样的事情又发生了。

有人可以提供一些有关原因的线索吗?

尝试在 MALLET 邮件列表上询问,但显然没有人回复。

最佳答案

我也对 MALLET 知之甚少,但文档提到了这一点......

Topic Inference

--inferencer-filename [FILENAME] Create a topic inference tool based on the current, trained model. Use the MALLET command bin/mallet infer-topics --help to get information on using topic inference.

Note that you must make sure that the new data is compatible with your training data. Use the option --use-pipe-from [MALLET TRAINING FILE] in the MALLET command bin/mallet import-file or import-dir to specify a training file.



也许你忘了这样做?在我看来,您正在训练的数据与您正在测试的数据的格式不同。

关于nlp - 关于 lda 推理,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4374296/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com