gpt4 book ai didi

machine-learning - 标记LDA使用

转载 作者:行者123 更新时间:2023-11-30 08:33:51 25 4
gpt4 key购买 nike

我正在做一个项目,需要应用主题模型LDA。因为我的案例中的每个文档都很短,所以我必须使用 Labeled LDA。我在这方面没有太多知识,我所需要做的就是将 LLDA 应用到我的数据中。

在网络上搜索后,我在 Stanford TMT 上找到了 LLDA 实现。我从训练带标签的LDA模型部分了解到的是:我应该在训练之前标记每个输入文档。我是不是误会了什么?

如果我的理解是正确的,这将涉及太多标记文档的工作。相反,我可以提供单独的主题列表,并训练没有标签的文档吗?

最佳答案

您的理解是正确的:您需要在训练之前对每个输入文档进行标记。

带标签的 LDA 是一种监督方法,这意味着您需要一个带标签的数据集。

如果您“必须使用带标签的 LDA”,您就无法摆脱获取带标签数据集的需要。如果TMT中的LabeledLDA模型需要一个LabeledLDADocumentParams对象,并且要具体化它,您需要标签数组。因此,不可以在没有标签的情况下训练有标签的 LDA 模型。

关于machine-learning - 标记LDA使用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16740154/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com