gpt4 book ai didi

nlp - 为什么斯坦福主题建模工具箱不生成 lda 输出目录?

转载 作者:行者123 更新时间:2023-11-30 09:24:18 25 4
gpt4 key购买 nike

我尝试运行此code from github (遵循 1-2-3 步骤)识别 Sarah Palin 的 14,500 封电子邮件中的 30 个主题。作者发现的主题为here 。但是,斯坦福主题建模工具箱没有为我生成 lda 输出目录。它生成了lda-86a58136-30-2b1a90a6,但该文件夹中的summary.txt仅显示了主题的初始分配,而不是最终的分配。知道如何生成包含所发现主题的最终摘要的 lda 输出目录吗?提前致谢!

最佳答案

您是否尝试过说明 posted here

请注意,我看到原始调查员使用 Sarah Palin 的电子邮件训练了模型,然后使用该训练模型来分析 Sarah Palin 的电子邮件。虽然我不是 LDA 专家,但这通常带有“找到你拥有的东西”的味道。

在大多数学科中,训练将针对一组已知的项目进行,这些项目已由专家根据判别式进行分类。这意味着训练将包括从其他来源提供一组已知可能主题的数据,然后使用 LDA 库来确定与“已学习”数据库中的主题的距离。

无论如何,祝你好运。

如果您遇到特定问题,请发布错误以及为解决该错误而采取的步骤。很少有人会在没有指导的情况下投入时间尝试重现问题(这是纠正问题的典型先决条件),甚至没有能力确定他们遇到的问题是否与您的问题相似。

关于nlp - 为什么斯坦福主题建模工具箱不生成 lda 输出目录?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10217049/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com