gpt4 book ai didi

machine-learning - 用于文档分类的监督潜在狄利克雷分配?

转载 作者:行者123 更新时间:2023-11-30 08:22:43 27 4
gpt4 key购买 nike

我在某些组中有一堆已经人类分类的文档。

是否有 lda 的修改版本,我可以用它来训练模型,然后用它对未知文档进行分类?

最佳答案

就其值(value)而言,LDA 作为分类器会相当弱,因为它是一个生成模型,而分类是一个判别问题。 LDA 有一个变体,称为 supervised LDA它使用更具辨别力的标准来形成主题(您可以在不同的地方获取源代码),还有一篇带有 max margin 的论文我不知道源代码的状态。我会避免使用带标签的 LDA 公式,除非您确定这就是您想要的,因为它对分类问题中主题和类别之间的对应关系做出了强有力的假设。

但是,值得指出的是,这些方法都没有直接使用主题模型来进行分类。相反,他们采用文档,而不是使用基于单词的特征,而是使用主题的后验(由文档推理产生的向量)作为其特征表示,然后将其输入到分类器(通常是线性 SVM)。这将为您提供基于主题模型的降维,然后是强大的判别性分类器,这可能就是您所追求的。该管道可用在大多数语言中使用流行的工具包。

关于machine-learning - 用于文档分类的监督潜在狄利克雷分配?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13555021/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com