gpt4 book ai didi

python - 遍历包含表单的网站的算法

转载 作者:塔克拉玛干 更新时间:2023-11-03 04:08:14 25 4
gpt4 key购买 nike

我成功记录了网站的所有链接,但遗漏了一些只能通过表单发布(例如登录)才能看到的链接。

我所做的是记录所有没有登录的链接。并采用了形式值。然后我发布了数据并记录了新链接,但是在这里我错过了其他不在发布链接中的表格和链接。

请建议任何有效的算法,以便我可以通过发布表单数据来获取所有链接。

提前致谢。

最佳答案

一组网页中的链接可以看作是一个 TreeMap ,因此您可以使用各种树遍历算法(如深度优先和广度优先搜索)来查找所有链接。链接和相关表单数据可以保存在队列或堆栈中,具体取决于您使用的遍历算法。

关于python - 遍历包含表单的网站的算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21612246/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com