python - 抓取网站时出现错误 "Took longer than 180.0 seconds"。为什么？-6ren

python - 抓取网站时出现错误 "Took longer than 180.0 seconds"。为什么？

转载作者：太空宇宙更新时间：2023-11-04 07:54:57

30

4

当我运行脚本时，scrapy 不断抛出此消息:

Took longer than 180.0 seconds

出现这个问题的原因是什么，有什么具体的解决办法吗？

这是此消息的屏幕截图。

最佳答案

您在下载时遇到了 scrapy 超时。

参见 DOWNLOAD_TIMEOUT

默认为 360 秒 = 6 分钟。调整您的设置以使其更长。

根据文档你的设置

can be populated using different mechanisms, each of which having a different precedence. Here is the list of them in decreasing order of precedence:

Command line options (most precedence)
Settings per-spider
Project settings module
Default settings per-command
Default global settings (less precedence)

你没有分享你的代码，所以很难说，但是你要么修改你的蜘蛛的设置，要么将它们作为命令行选项提供。

scrapy crawl myspider -s DOWNLOAD_TIMEOUT=<some value that benefits you crawling>

或者你可以像这样为每个蜘蛛设置它们:

class MySpider(scrapy.Spider):
    name = 'myspider'

    custom_settings = {
        'DOWNLOAD_TIMEOUT': 'some value',
    }

有关更多信息，请阅读 the settings-manual

关于python - 抓取网站时出现错误 "Took longer than 180.0 seconds"。为什么？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50118568/

30

4

0

文章推荐： python - Google Bigquery 的 TIMESTAMP 的 python 数据类型是什么？

文章推荐： java 删除包含两个子节点的二叉树节点

文章推荐： java - 从目录+子目录中读取

文章推荐： java - JAXB解析类似的xml文件

elasticsearch - Elasticsearch "took"与手动计算的时间差
我不明白为什么 ES 时间和查询时间之间会有这样的差异。 var url = "192.168.100.11:9200"; var elasticsearch = require('elasticse
戈朗 : Learning goroutine took me to a deadlock
我是一个 GO 新手，我正在尝试弄清楚 goroutines 是如何工作的以及如何同步它们。这是我编写的一个简单程序来了解它们: package main import ( "fmt"
elasticsearch - 当“took”增加时，从输出返回的“from”增加
假设我的查询将返回100,000条匹配记录，但是对于每个页面，我只想返回100条记录: { "from": 0, "size": 100, //and here goes th
elasticsearch - ElasticSearch配置文件API的 `time_in_nanoseconds`值高于 `took`时间
我正在使用ElasticSearch配置文件API来帮助进行慢速查询。当我阅读the elasticsearch profiling docs时，听起来像分片中查询的time_in_nanos值应小
shiny - 错误: The application took too long to respond
我有一个 Shiny 的服务器(1.3.0.403)，在虚拟机中运行的 Red Hat Enterprise Linux Server 版本 6.5(圣地亚哥)上运行。某些应用程序在启动时失败，并显
android - 应用内结算失败，返回 "Took too long to deliver"
我正在将应用内结算集成到我的非托管产品应用程序中。我已经在市场上配置了我的应用程序以实现 BILLING 权限。我已经发布了我的应用程序的开发版本所期望的产品 ID。到目前为止，我一直在使用测试产品，
arrays - Golang : process took too long. 实现拼写检查
http://play.golang.org/p/H5E0ExL85d 我已经用 Go 实现了一些 Peter Norvig 的拼写检查算法。奇怪的是，前三个调用工作正常，为我提供了所需的输出。
javascript - 违规: 'setTimeout' handler took ms
数组包含随机值喜欢 let checkTypes = ['a','b','c']; 。 (数组的长度也是随机的。) 并且，数组尝试调用函数 this.switch()按数组数量。所以，我的代码是..
javascript - 正则表达式错误 : The Expression took longer than 250ms to execute
在执行正则表达式时出现错误 /^"?(\w*\d*\s*-*\/*'*)+"?$/ 它可能是重复的，但我找不到确切的解决方案。这是场景。字符串可以接受: a: 它可以接受双引号 "" 仅在字符串的开
c# - 正则表达式错误 : expression took longer than ms to execute
所以这是我使用 C# 从特定字符串中提取 CSS 的正则表达式模式: (([\s]*\/\*[^\*]+\*\/)?((@media|@keyframes)[^{]+\{[\s]*)?(((\b(ht
wordpress - WP一键部署GCP添加HTTP/S SSL : Took to long to respond
我在谷歌云上使用“一键部署”创建了一个 Wordpress VM 实例。当我尝试向站点添加 SSL 功能时，我使用了此 tutorial 中的步骤. 服务器端更改 default-ssl.conf
ios - Facebook SDK : Knowing if sharing took place
我正在使用 HelloFacebookSample 中的代码从我的应用程序共享一个链接，但我不知道如何知道共享是否真的发生了。我用它来分享: FBAppCall *appCall = [FBDialo
android - 艺术 : Verification of X took Y ms
我的 logcat 中有一个警告: W/art: Verification of void com.myapp.LoginFragment$override.lambda$logIn$5(com.my
node.js - EC2 实例 'took too long to respond'
我有一个基于 NodeJS 构建的站点，我目前正尝试将其部署在 AWS 的免费套餐上。到目前为止，我已经创建并启动了一个实例，我可以通过 SSH(控制台)连接到我的实例，并成功地从我的 Git 存储
Java GAE : Process terminated because the backend took too long to shutdown
我正在 Google Appengine 应用程序的后端实例中运行一个长任务(大约 6 小时)。这是后端配置: B4_1G true false
python - 抓取网站时出现错误 "Took longer than 180.0 seconds"。为什么？
当我运行脚本时，scrapy 不断抛出此消息: Took longer than 180.0 seconds 出现这个问题的原因是什么，有什么具体的解决办法吗？这是此消息的屏幕截图。最佳答案您在
ios - 线程警告 : ['Camera' ] took '290.006104' ms. 插件应使用后台线程
我正在为 IOS 构建一个 Phonegap 应用程序。我使用 Cordova 相机 plugin 上传个人资料图片。我的示例代码是: navigator.camera.getPicture(that
javascript - Chrome 违规 : [Violation] Handler took 83ms of runtime
我正在尝试在我的项目中实现 Facebook 的注销功能。登录工作正常。但是我在 JavaScript 控制台中遇到了带有注销代码的以下消息。 [Violation] Long running Jav
unity3d - 统一错误 : X server took longer than 2002 milliseconds to respond to
每当我启动 Unity Editor 时，我总是在控制台中收到多条相同的错误消息，以及一条 NullReferenceException。这些是什么，我该如何解决？我尝试在网上搜索并没有找到任何东西
java - 任务队列任务遇到 "Process terminated because the backend took too long to shutdown"过于频繁
我有处理 GAE 数据库中的记录并上传到谷歌云的工作。由于要花很长时间，所以我使用任务队列一次处理一小批。但是我在日志中看到了非常一致的“进程终止，因为后端关闭时间太长”的问题。我知道我只有 30 秒

首页

博学

6Ren·AI

商城

python - 抓取网站时出现错误 "Took longer than 180.0 seconds"。为什么？