gpt4 book ai didi

python-3.x - 无监督文本分类

转载 作者:行者123 更新时间:2023-11-30 09:01:11 26 4
gpt4 key购买 nike

我使用 Python 3 和 sklearn 构建了一个垃圾邮件分类器。对于垃圾邮件/火腿分类,我使用了支持向量机,它具有相当好的准确性(~99%)

我现在面临的问题是,一旦我对火腿邮件进行了分类,我想自动对它们进行分类,例如:与政治相关的邮件、与音乐相关的邮件等等,并将它们放入特定的存储桶中。

挑战是我无法用特定类型的邮件训练算法,因为我不知道什么类型的邮件可能会出现在我的收件箱中,所以我陷入了这个阶段。如果有人可以分享一些解决方法,那就太好了。谢谢。

最佳答案

您可以查看Latent Dirichlet allocation (topic modelling技术)。但此模型将返回未标记的电子邮件组。

关于python-3.x - 无监督文本分类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34999564/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com