gpt4 book ai didi

python - 自学习url过滤器

转载 作者:行者123 更新时间:2023-11-30 09:36:36 30 4
gpt4 key购买 nike

我需要通过 python 脚本将给定的网址分类为色情或非色情(而不是亲自访问它们并观看视频),并且我考虑通过对其包含的单词进行分类来计算每个网址的色情概率,例如如果 url 包含单词“bang”和“18”,那么很可能是它的色情网站,我尝试实现它,但它不是很准确,是否有任何 python 库可以帮助我对这些 url 进行分类?我正在寻找可以从测试数据中学习的库,例如智能反垃圾邮件过滤器,例如:

    data = {
'google.com':0,
'superxxx.com':1,
'bigbangtheory.com':0,
'hot18bangbang.com':1,
...
...
}

等等,我收集了相当多的“坏”网址,所以我想我可以训练一些人工智能分类器。如果这是个坏主意,你能推荐我任何从“好”网址中过滤掉“坏”网址的方法吗?

最佳答案

这是逻辑回归的一个很好的用例,但对于 Stack Overflow 来说这不是一个很好的问题。如果您已经有了训练数据,请去找一个工具(或者自己实现这个工具,因为它不会那么困难),然后询问您在让它工作时遇到的麻烦。 Stack Overflow 不是提供使用工具建议的地方。

关于python - 自学习url过滤器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39935279/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com