gpt4 book ai didi

python - Scrapy 表示没有抓取任何页面/项目?

转载 作者:太空宇宙 更新时间:2023-11-03 19:00:54 26 4
gpt4 key购买 nike

我的蜘蛛当前正在从网站上抓取 xml。这样做是成功的,因为我可以看到通过数据库管道存储的项目。

但是,当我查看日志(设置为 log.INFO)时,它表明没有抓取任何内容?

2013-04-12 11:58:00-0400 [traffics] INFO: Spider opened
2013-04-12 11:58:00-0400 [traffics] INFO: Crawled 0 pages (at 0 pages/min), scraped 0 items (at 0 items/min)
2013-04-12 11:58:03-0400 [traffics] INFO: Closing spider (finished)
2013-04-12 11:58:03-0400 [traffics] INFO: Dumping Scrapy stats:
{'downloader/request_bytes': 273,
'downloader/request_count': 1,
'downloader/request_method_count/GET': 1,
'downloader/response_bytes': 28883,
'downloader/response_count': 1,
'downloader/response_status_count/200': 1,
'finish_reason': 'finished',
'finish_time': datetime.datetime(2013, 4, 12, 15, 58, 3, 469842),
'log_count/DEBUG': 7,
'log_count/INFO': 4,
'response_received_count': 1,
'scheduler/dequeued': 1,
'scheduler/dequeued/memory': 1,
'scheduler/enqueued': 1,
'scheduler/enqueued/memory': 1,
'start_time': datetime.datetime(2013, 4, 12, 15, 58, 0, 907300)}
2013-04-12 11:58:03-0400 [traffics] INFO: Spider closed (finished)

为什么它确实在抓取(并随后将它们保存到数据库),却说抓取了 0 个项目和 0 个页面?

最佳答案

数据库管道中的 process_item 方法是否在存储项目后返回该项目?

关于python - Scrapy 表示没有抓取任何页面/项目?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16089126/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com