gpt4 book ai didi

machine-learning - 如何使用 LDA 或任何主题建模算法获取文档的意图

转载 作者:行者123 更新时间:2023-11-30 09:41:51 26 4
gpt4 key购买 nike

我需要根据一组文档的意图对它们进行聚类,并且我计划使用 LDA(潜在狄利克雷分配 - 主题建模)。

我可以通过主题建模获得对文档进行分组的意图吗?是否有任何其他算法可以根据文档的意图对文档进行聚类。这种使用主题建模进行意图聚类的方法好吗?

我一直在主题建模中尝试LDA算法,并且能够获取主题列表,但不确定我是否可以将主题视为意图本身。

期待一种根据文档组的意图对文档组进行聚类的方法。

最佳答案

如上所述here LDA 忽略了单词之间如何交互的结构,它不适合意图建模

As a bag-of-words model is used to represent the documents, LDA can suffer from the same disadvantages as the bag-of-words model. The LDA model learns a document vector that predicts words inside of that document while disregarding any structure or how these words interact on a local level.

考虑以下句子:
这是他姐姐的狗(声明)
这是他姐姐的狗吗(问题)

同样的话,不同的顺序,不同的意图。

您可能需要标记数据,以及使用 CNN 或 LSTM 等神经网络。

关于machine-learning - 如何使用 LDA 或任何主题建模算法获取文档的意图,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57572400/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com