- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
当我运行脚本时,scrapy 不断抛出此消息:
Took longer than 180.0 seconds
出现这个问题的原因是什么,有什么具体的解决办法吗?
这是此消息的屏幕截图。
最佳答案
您在下载时遇到了 scrapy 超时。
默认为 360 秒 = 6 分钟。调整您的设置以使其更长。
根据文档你的设置
can be populated using different mechanisms, each of which having a different precedence. Here is the list of them in decreasing order of precedence:
Command line options (most precedence)
Settings per-spider
Project settings module
Default settings per-command
Default global settings (less precedence)
你没有分享你的代码,所以很难说,但是你要么修改你的蜘蛛的设置,要么将它们作为命令行选项提供。
scrapy crawl myspider -s DOWNLOAD_TIMEOUT=<some value that benefits you crawling>
或者你可以像这样为每个蜘蛛设置它们:
class MySpider(scrapy.Spider):
name = 'myspider'
custom_settings = {
'DOWNLOAD_TIMEOUT': 'some value',
}
有关更多信息,请阅读 the settings-manual
关于python - 抓取网站时出现错误 "Took longer than 180.0 seconds"。为什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50118568/
我不明白为什么 ES 时间和查询时间之间会有这样的差异。 var url = "192.168.100.11:9200"; var elasticsearch = require('elasticse
我是一个 GO 新手,我正在尝试弄清楚 goroutines 是如何工作的以及如何同步它们。这是我编写的一个简单程序来了解它们: package main import ( "fmt"
假设我的查询将返回100,000条匹配记录,但是对于每个页面,我只想返回100条记录: { "from": 0, "size": 100, //and here goes th
我正在使用ElasticSearch配置文件API来帮助进行慢速查询。 当我阅读the elasticsearch profiling docs时,听起来像分片中查询的time_in_nanos值应小
我有一个 Shiny 的服务器(1.3.0.403),在虚拟机中运行的 Red Hat Enterprise Linux Server 版本 6.5(圣地亚哥)上运行。 某些应用程序在启动时失败,并显
我正在将应用内结算集成到我的非托管产品应用程序中。我已经在市场上配置了我的应用程序以实现 BILLING 权限。我已经发布了我的应用程序的开发版本所期望的产品 ID。到目前为止,我一直在使用测试产品,
http://play.golang.org/p/H5E0ExL85d 我已经用 Go 实现了一些 Peter Norvig 的拼写检查算法。 奇怪的是,前三个 调用工作正常,为我提供了所需的输出。
数组包含随机值喜欢 let checkTypes = ['a','b','c']; 。 (数组的长度也是随机的。) 并且,数组尝试调用函数 this.switch()按数组数量。 所以,我的代码是..
在执行正则表达式时出现错误 /^"?(\w*\d*\s*-*\/*'*)+"?$/ 它可能是重复的,但我找不到确切的解决方案。 这是场景。字符串可以接受: a: 它可以接受双引号 "" 仅在字符串的开
所以这是我使用 C# 从特定字符串中提取 CSS 的正则表达式模式: (([\s]*\/\*[^\*]+\*\/)?((@media|@keyframes)[^{]+\{[\s]*)?(((\b(ht
我在谷歌云上使用“一键部署”创建了一个 Wordpress VM 实例。 当我尝试向站点添加 SSL 功能时,我使用了此 tutorial 中的步骤. 服务器端更改 default-ssl.conf
我正在使用 HelloFacebookSample 中的代码从我的应用程序共享一个链接,但我不知道如何知道共享是否真的发生了。我用它来分享: FBAppCall *appCall = [FBDialo
我的 logcat 中有一个警告: W/art: Verification of void com.myapp.LoginFragment$override.lambda$logIn$5(com.my
我有一个基于 NodeJS 构建的站点,我目前正尝试将其部署在 AWS 的免费套餐上。 到目前为止,我已经创建并启动了一个实例,我可以通过 SSH(控制台)连接到我的实例,并成功地从我的 Git 存储
我正在 Google Appengine 应用程序的后端实例中运行一个长任务(大约 6 小时)。 这是后端配置: B4_1G true false
当我运行脚本时,scrapy 不断抛出此消息: Took longer than 180.0 seconds 出现这个问题的原因是什么,有什么具体的解决办法吗? 这是此消息的屏幕截图。 最佳答案 您在
我正在为 IOS 构建一个 Phonegap 应用程序。我使用 Cordova 相机 plugin 上传个人资料图片。我的示例代码是: navigator.camera.getPicture(that
我正在尝试在我的项目中实现 Facebook 的注销功能。登录工作正常。但是我在 JavaScript 控制台中遇到了带有注销代码的以下消息。 [Violation] Long running Jav
每当我启动 Unity Editor 时,我总是在控制台中收到多条相同的错误消息,以及一条 NullReferenceException。 这些是什么,我该如何解决?我尝试在网上搜索并没有找到任何东西
我有处理 GAE 数据库中的记录并上传到谷歌云的工作。由于要花很长时间,所以我使用任务队列一次处理一小批。但是我在日志中看到了非常一致的“进程终止,因为后端关闭时间太长”的问题。我知道我只有 30 秒
我是一名优秀的程序员,十分优秀!