gpt4 book ai didi

python - 如果满足条件则终止 Scrapy

转载 作者:太空狗 更新时间:2023-10-30 00:36:03 28 4
gpt4 key购买 nike

我在 python 中使用 scrapy 编写了一个爬虫。它包含 100 个 start_url。

我想在满足条件后终止抓取过程。即终止抓取特定的 div 被发现。终止我的意思是它应该停止抓取所有的 url。

可以吗

最佳答案

您正在寻找的是 CloseSpider exception .

在源文件顶部的某处添加以下行:

from scrapy.exceptions import CloseSpider

当您检测到您的终止条件得到满足时,只需执行类似的操作

        raise CloseSpider('termination condition met')

在你的回调方法中(而不是返回或生成一个 ItemRequest)。

请注意,仍在进行中的请求(已发送 HTTP 请求,尚未收到响应)仍将被解析。但是不会处理任何新请求。

关于python - 如果满足条件则终止 Scrapy,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23884743/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com