gpt4 book ai didi

machine-learning - 使用一个 "majority topic"和多个 "minority topics"对语料库进行主题建模

转载 作者:行者123 更新时间:2023-11-30 09:37:52 26 4
gpt4 key购买 nike

我收集了一些文档,其中大部分都是关于同一主题的,其余的基本上都是随机主题。我希望将文档分类为它们是关于“多数主题”还是这些随机“少数主题”之一。如果我在这个只有 2 个主题的语料库上使用主题建模算法会发生什么?即使“少数主题”彼此之间可能没有太多相似性,语料库是否会被划分为“多数主题”和“少数主题”?

最佳答案

您可以使用 MonkeyLearn 来实现此目的。

您可以创建包含两个主题的自定义分类器:“多数主题”和“少数主题”。您必须为每个类别添加一些训练样本,以便 MonkeyLearn 可以学习预测每个类别。

训练分类器后,它可以通过 API 与任何编程语言集成。

您可以在这里免费试用 MonkeyLearn:http://www.monkeylearn.com

如果您有任何疑问,请在此处发表评论或发送电子邮件至 hello@monkeylearn.com,我随时为您提供帮助。

干杯,

费德里科

关于machine-learning - 使用一个 "majority topic"和多个 "minority topics"对语料库进行主题建模,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29170465/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com