gpt4 book ai didi

python - 碎片化 1.0 : How to run crawler in Celery?

转载 作者:行者123 更新时间:2023-11-28 18:34:11 28 4
gpt4 key购买 nike

我尝试了文档 http://doc.scrapy.org/en/stable/topics/practices.html 中的示例,但第二次运行时会出现错误ReactorNotRestartable

settings = get_project_settings()

runner = CrawlerRunner(settings=settings)

@defer.inlineCallbacks
def crawl():
yield runner.crawl(LatestNewsSpider)
reactor.stop()

def run_spider():
crawl()
reactor.run()

最佳答案

在您的 Celery 设置中将 CELERYD_MAX_TASKS_PER_CHILD 设置为 1。这将在每个子进程中只运行一个任务,因此它永远不会在同一进程中多次启动 react 器。

或者,您可以在一个线程中运行 react 器并且永远不会停止它。我不知道它是否行得通。 crochet可能有用。

关于python - 碎片化 1.0 : How to run crawler in Celery?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34065315/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com