gpt4 book ai didi

machine-learning - 公开的垃圾邮件过滤器培训套件

转载 作者:行者123 更新时间:2023-11-30 08:20:15 25 4
gpt4 key购买 nike

我是机器学习新手,对于我的第一个项目,我想编写一个朴素贝叶斯垃圾邮件过滤器。我想知道是否有任何公开可用的标记垃圾邮件/非垃圾邮件的训练集,最好是纯文本形式,而不是关系数据库的转储(除非他们漂亮地打印这些?)。

我知道存在这样一个公开可用的数据库,用于其他类型的文本分类,特别是新闻文章文本。我只是找不到电子邮件的同类内容。

最佳答案

这是我正在寻找的内容:http://untroubled.org/spam/

此存档包含大约 1 GB 的压缩累积垃圾邮件,日期为 1998 年至 2011 年。现在我只需要获取非垃圾邮件。因此,我将使用 getmail 程序和 mattcutts.com 上的教程来查询我自己的 Gmail。

关于machine-learning - 公开的垃圾邮件过滤器培训套件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4743996/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com