gpt4 book ai didi

python - 如何重启Scrapy spider

转载 作者:太空狗 更新时间:2023-10-29 21:45:22 26 4
gpt4 key购买 nike

我需要什么:

  1. 启动爬虫
  2. 爬虫工作完成
  3. 等一分钟
  4. 再次启动爬虫

我试试这个:

from scrapy.crawler import CrawlerProcess
from scrapy.utils.project import get_project_settings
from time import sleep

while True:
process = CrawlerProcess(get_project_settings())
process.crawl('spider_name')
process.start()
sleep(60)

但是报错:

twisted.internet.error.ReactorNotRestartable

请帮我做对

python 3.6
碎片化 1.3.2
Linux

最佳答案

为了避免 ReactorNotRestartable 错误,您可以尝试创建一个 main.py 文件,从中使用 subprocesses 从 shell 多次调用爬虫。

这个 main.py 文件可能是这样的:

from time import sleep
import subprocess

timeout = 60

while True:
command = 'scrapy crawl yourSpiderName'
subprocess.run(command, shell=True)
sleep(timeout)

关于python - 如何重启Scrapy spider,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42333538/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com