gpt4 book ai didi

machine-learning - 如何在新闻文章中使用 gensim 进行 lda?

转载 作者:行者123 更新时间:2023-11-30 08:33:06 25 4
gpt4 key购买 nike

我正在尝试从大量新闻文章中检索主题列表,我计划使用 gensim 使用 LDA 提取每个文档的主题分布。我想知道 gensim 实现 lda 所需的已处理文章的格式以及如何将原始文章转换为该格式。我在维基百科转储上看到了有关使用 lda 的链接,但我发现语料库处于已处理状态,其格式在任何地方都没有提及

最佳答案

我不知道我的问题是否正确,但是gensim支持多个语料库。您可以找到它们的列表 here

如果你想处理自然语言,你必须首先对文本进行标记。您可以按照gensim网站here上的分步教程进行操作。已经解释得很清楚了。

关于machine-learning - 如何在新闻文章中使用 gensim 进行 lda?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9969599/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com