python - Scrapy 爬取速度慢(60 页/分钟)-6ren

python - Scrapy 爬取速度慢(60 页/分钟)

转载作者：太空狗更新时间：2023-10-29 21:10:10

我的 scrapy 爬行速度很慢(大约 1 页/秒)。我正在从 aws 服务器抓取一个主要网站，所以我认为这不是网络问题。 CPU 利用率远未接近 100，如果我启动多个 scrapy 进程，爬网速度会快得多。

Scrapy 好像爬了一堆页面，然后挂了几秒，然后重复。

我试过玩:CONCURRENT_REQUESTS = CONCURRENT_REQUESTS_PER_DOMAIN = 500

但这似乎并没有真正让指针超过 20。

最佳答案

您确定允许高速抓取目标站点吗？许多网站实现下载阈值，“一段时间后”开始响应缓慢。

关于python - Scrapy 爬取速度慢(60 页/分钟)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/13505194/

php - 推荐一个 PHP 脚本来创建 XML 站点地图？ (爬/刮方法)
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的，

太空狗

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章