gpt4 book ai didi

machine-learning - 两个不同数量主题的 LDA 结果之间的相似性?

转载 作者:行者123 更新时间:2023-11-30 09:38:03 25 4
gpt4 key购买 nike

如果我们在LDA中选择20个主题,然后如果我们选择30个主题。所以我的问题是,这些结果是否会与这 20 个主题相交并产生相似的结果

最佳答案

简短的回答 - 不。 LDA 的工作方式是使用吉布斯采样器来获取文档向量上的狄利克雷分布。然后对该样本进行分配,因此由于采样随机性和分配不确定性,分配总是不同的,除非您定义显式随机种子并运行相同数量的主题 k。看看 Blei 等人的原始论文。 2003 了解 k 是如何定义的。

更新(关于评论):分层LDA(hLDA)试图通过遵循中餐馆模型构建主题级别来解决保留主题和子主题的问题。但它仍然不完美。

然而,扁平 LDA 的工作方式是查看文档而不是主题来产生进一步的结果。比如说,你得到主题 0(餐厅的第一张 table ),所有文档都尝试坐在那里,但空间不够,你创建了另一个主题 1,其中一些文档感觉更舒服,等等,等等。现在你就从从如何创建这些表的角度来看。但是有一件大事很关键 - 当您创建新表/主题 1 时,主题 0 会发生变化,因为某些文档已经离开第一个表,并将单词(或其共现概率)带到新表中,并且其中的所有单词鉴于新情况,主题 0 进行了重新洗牌。当您创建更多表/主题时,会发生同样的情况,并且之前的所有表/主题也会被重新估计。因此,当使用 30 个主题重新运行时,您将永远不会得到相同的 20 个主题。

关于machine-learning - 两个不同数量主题的 LDA 结果之间的相似性?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24462879/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com