python - 碎片化 1.0 : How to run crawler in Celery?-6ren

python - 碎片化 1.0 : How to run crawler in Celery?

转载作者：行者123 更新时间：2023-11-28 18:34:11

我尝试了文档 http://doc.scrapy.org/en/stable/topics/practices.html 中的示例，但第二次运行时会出现错误ReactorNotRestartable。

settings = get_project_settings()

runner = CrawlerRunner(settings=settings)

@defer.inlineCallbacks
def crawl():
    yield runner.crawl(LatestNewsSpider)
    reactor.stop()

def run_spider():
    crawl()
    reactor.run()

最佳答案

在您的 Celery 设置中将 CELERYD_MAX_TASKS_PER_CHILD 设置为 1。这将在每个子进程中只运行一个任务，因此它永远不会在同一进程中多次启动 react 器。

或者，您可以在一个线程中运行 react 器并且永远不会停止它。我不知道它是否行得通。 crochet可能有用。

关于python - 碎片化 1.0 : How to run crawler in Celery?，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34065315/

文章推荐： javascript - 将链接从 Facebook 重定向到网站 - javascript？

文章推荐： python - 在 Pandas 中使用 read_html() 时出错

文章推荐： Python:tarfile 流

文章推荐： CSS "absolute"没有停留在一个地方

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - 碎片化 1.0 : How to run crawler in Celery?