gpt4 book ai didi

selenium-webdriver - Scrapy 或 Selenium 或 Mechanize 来抓取网络数据?

转载 作者:行者123 更新时间:2023-12-04 02:15:12 24 4
gpt4 key购买 nike

我想从网站上抓取一些数据。

基本上,该网站有一些表格显示并显示大约 50 条记录。对于更多记录,用户必须单击某个按钮,使 ajax 调用获取并显示接下来的 50 条记录。

我以前了解 Selenium webdriver(Python)。我可以在 Selenium 中很快地做到这一点。但是,Selenium 更像是一种自动化测试工具,而且速度很慢。

我做了一些研发,发现使用 Scrapy 或 Mechanize,我也可以做同样的事情。

我应该为此选择 Scrapy 还是 Mechanize 或 Selenium?

最佳答案

我建议您结合使用 Mechanize 和 ExecJS ( https://github.com/sstephenson/execjs ) 来执行您可能遇到的任何 javascript 请求。我已经结合使用这两种 gem 已经有一段时间了,它们做得很好。

您应该选择它而不是 Selenium,因为与必须在 headless 浏览器中渲染整个页面相比,它会快得多。

关于selenium-webdriver - Scrapy 或 Selenium 或 Mechanize 来抓取网络数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20939401/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com