gpt4 book ai didi

algorithm - 用于主题建模的 Amazon Sagemaker 中的 LDA 和 NTM 有什么区别?

转载 作者:行者123 更新时间:2023-12-04 02:41:38 25 4
gpt4 key购买 nike

我正在寻找 LDA 和 NTM 之间的区别。您将在 NTM 上使用 LDA 的一些用例是什么?

根据 AWS 文档:

LDA:Amazon SageMaker 潜在狄利克雷分配 (LDA) 算法是一种无监督学习算法,它试图将一组观察结果描述为不同类别的混合。 LDA 最常用于发现文本语料库中文档共享的用户指定数量的主题。

虽然您可以同时使用 Amazon SageMaker NTM 和 LDA 算法进行主题建模,但它们是不同的算法,预计会对相同的输入数据产生不同的结果。

最佳答案

LDA和NTM有不同的科学逻辑:

SageMaker LDA (潜在狄利克雷分配,不要与 Linear Discriminant Analysis 混淆)模型的工作原理是假设文档是通过从有限的主题集中采样单词而形成的。它由 2 个事件部分组成:(1)每个主题的单词组成和(2)每个文档的主题组成

SageMaker NTM另一方面,它没有明确地学习每个主题的单词分布,它是一个神经网络,它通过瓶颈层传递文档并尝试重现输入文档(根据 AWS documentation,大概是一个变分自动编码器(VAE))。这意味着瓶颈层最终包含所有必要的信息来预测文档组成,其系数可以被视为主题

以下是选择其中之一的注意事项:

  • 基于 VAE 的方法(如 SageMaker NTM)可能比 LDA 更好地识别相关主题 ,大概是因为它们可能具有更深层次的表达能力。 A benchmark here (具有可能与 SageMaker NTM 不同的 VAE-NTM)表明 NTM 在主题一致性和困惑度两个指标上都可以击败 LDA
  • 到目前为止,关于 LDA 的社区知识似乎比关于 VAE、NTM 和 SageMaker NTM 的社区知识更多 .如果您使用 LDA,这意味着可能更容易学习和排除故障。不过,事情变化很快,因此随着 DL 知识的增长,这一点可能越来越不相关
  • SageMaker NTM 具有比 SageMaker LDA 更灵活的硬件选项,并且可以更好地扩展 :SageMaker NTM 可以在 CPU、GPU、多 GPU 实例和多实例上下文上运行。例如,官方的 NTM 演示使用了一个 2 ml.c4.xlarge 的临时集群。实例。 SageMaker LDA 目前仅支持单实例 CPU 训练。
  • 关于algorithm - 用于主题建模的 Amazon Sagemaker 中的 LDA 和 NTM 有什么区别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59109982/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com