gpt4 book ai didi

从有意义的文本中分离无意义文本的算法

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:31:10 24 4
gpt4 key购买 nike

我为我的一些程序提供了反馈功能。不幸的是,我忘了包括某种垃圾邮件保护——这样用户就可以将他们想要的任何东西发送到我的服务器——每个反馈都存储在一个巨大的数据库中。

一开始我会定期检查这些反馈 - 我过滤掉了可用的并删除了垃圾。问题是:我每天收到 900 条反馈。只有 4-5 条真正有用,其他消息大多是 2 种乱码:

  • 废话:jfvgasdjkfahs kdlfjhasdf(人们在键盘上砸脑袋)
  • 我不懂的语言

到目前为止我做了什么:

  1. 我安装了一个过滤器来删除任何包含“asdf”、“qwer”等的反馈...-> 每天只有 700 个

  2. 我安装了一个单词过滤器来删除任何包含不良语言的内容 -> 每天 600 个(不要问 - 但那里有很多奇怪的人)

  3. 我过滤掉所有包含未在我的语言中使用的字母的消息 -> 每天 400 条

但是每天 400 个还是太多了。所以我想知道是否有人以前处理过这样的问题并且知道某种算法来过滤掉无意义的消息。

非常感谢任何帮助!

最佳答案

如何只使用贝叶斯垃圾邮件过滤器的一些现有实现而不是实现您自己的。我在 DSpam 上取得了不错的成绩

关于从有意义的文本中分离无意义文本的算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/501675/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com