gpt4 book ai didi

machine-learning - 用机器学习来理解 Python 中的网站结构

转载 作者:行者123 更新时间:2023-11-30 09:02:27 25 4
gpt4 key购买 nike

我一直致力于抓取网页并提取网站的元素。前任:给定一个网站 - 爬虫应返回以下部分:页眉、菜单、页脚、内容等。

我在想,如果我能使用机器学习来训练代码以学习如何对网站进行分类,那就太好了。

我尝试查看 Python 机器学习库(例如:PyBrain),但示例非常复杂。谁能给我推荐一个库和一些教程,通过一些简单的示例来开始使用 Python 机器学习?

谢谢!

最佳答案

MLPy对您来说可能是一个更简单的开始。这是documentation on classification的链接。顺便说一句,如果您不知道类应该是什么样子,也许您需要 cluster您的页面,而不是对它们进行分类。

关于machine-learning - 用机器学习来理解 Python 中的网站结构,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7861628/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com