gpt4 book ai didi

scrapy - 如何在运行时监控scrapy的状态

转载 作者:行者123 更新时间:2023-12-01 15:19:42 26 4
gpt4 key购买 nike

我想知道 scrapy 运行时发生了什么,如何监控状态?

最佳答案

有两种方法。第一种方法,这里以官方文档为例。

telnet localhost 6023
>>> est()
Execution engine status
time()-engine.start_time : 8.62972998619
engine.has_capacity() : False
len(engine.downloader.active) : 16
engine.scraper.is_idle() : False
engine.spider.name : followall
engine.spider_is_idle(engine.spider) : False
engine.slot.closing : False
len(engine.slot.inprogress) : 16
len(engine.slot.scheduler.dqs or []) : 0
len(engine.slot.scheduler.mqs) : 92
len(engine.scraper.slot.queue) : 0
len(engine.scraper.slot.active) : 0
engine.scraper.slot.active_size : 0
engine.scraper.slot.itemproc_size : 0
engine.scraper.slot.needs_backout() : False

更多信息请引用官方文档。

第二种方法似乎更简单一些。您可以通过以下方法获取爬虫的状态:

    self.crawler.stats.get_stats() 
or
spider.crawler.stats.get_stats()

所以,只要打印出你喜欢的状态就可以了。

关于scrapy - 如何在运行时监控scrapy的状态,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26336295/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com