python - 如何在多个 scrapy 蜘蛛在同一进程中运行时停止 react 堆-6ren

python - 如何在多个 scrapy 蜘蛛在同一进程中运行时停止 react 堆

转载作者：太空狗更新时间：2023-10-29 21:55:21

33

4

我已经阅读了 here和 here ，并使在同一进程中运行的多个蜘蛛工作。

但是，我不知道如何设计一个信号系统来在所有蜘蛛完成后停止 react 器

我的代码与以下示例非常相似:

from twisted.internet import reactor
from scrapy.crawler import Crawler
from scrapy.settings import Settings
from scrapy import log
from testspiders.spiders.followall import FollowAllSpider

def setup_crawler(domain):
    spider = FollowAllSpider(domain=domain)
    crawler = Crawler(Settings())
    crawler.configure()
    crawler.crawl(spider)
    crawler.start()

for domain in ['scrapinghub.com', 'insophia.com']:
    setup_crawler(domain)
log.start()
reactor.run()

爬虫全部停止后，reactor还在运行。如果我添加语句

crawler.signals.connect(reactor.stop, signal=signals.spider_closed)

setup_crawler 函数，reactor 在第一个爬虫关闭时停止。

任何人都可以告诉我如何在所有爬虫完成后让 react 堆停止吗？

最佳答案

除了 shackra 的回答，采取那条路线确实有效。您可以将信号接收器创建为保留状态的闭包，这意味着它会记录已完成的蜘蛛数量。您的代码应该知道您正在运行多少个蜘蛛，因此检查所有蜘蛛何时运行然后运行 reactor.stop() 应该是一件简单的事情。

例如

将信号接收器链接到您的爬虫:

crawler.signals.connect(spider_finished, signal=signals.spider_closed)

创建信号接收器:

def spider_finished_count():
    spider_finished_count.count = 0

    def inc_count(spider, reason):
        spider_finished_count.count += 1
        if spider_finished_count.count == NUMBER_OF_SPIDERS:
            reactor.stop()
    return inc_count
spider_finished = spider_finished_count()

NUMBER_OF_SPIDERS 是您在此进程中运行的爬虫总数。

或者您可以反过来做，从运行的蜘蛛数量倒数到 0。或者更复杂的解决方案可能涉及保留哪些蜘蛛已完成和未完成等的字典。

注意:inc_count 被发送到 spider 和 reason，我们在这个例子中没有使用它们，但您可能希望使用这些变量:它们是从信号调度器发送的，并且是关闭的蜘蛛及其关闭的原因 (str)。

Scrapy版本:v0.24.5

关于python - 如何在多个 scrapy 蜘蛛在同一进程中运行时停止 react 堆，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/18787750/

33

4

0

文章推荐： c# - 创建动画按钮

文章推荐： python - Python 中的多行匹配

文章推荐： python - 放入 Python 异常消息的详细信息量的约定？

文章推荐： c# - 登录表单没有正确失去焦点

html - react react react react
问题是，当用户回复彼此的帖子时，我必须这样做: margin-left:40px; 对于 1 级深度 react margin-left:80px; 对于 2 层深等但是我想让 react div
react-router - 如何在 React VR 中使用 React React Router？
我试图弄清楚如何将 React Router 与 React VR 连接起来。首先，我应该使用 react-router dom/native ?目前尚不清楚，因为 React VR 构建在 Rea
reactjs - import * as React from 'react' 与 import React from 'react' 有什么区别
我是 React 或一般编码背景的新手。我不确定这些陈述之间有什么区别 import * as react from 'react' 和 import react from 'react' 提前致谢!
javascript - react、react-native、react-dom、react-test-renderer包的版本冲突
我正在使用最新的稳定版本的 react、react-native、react-test-renderer、react-dom。然而，react-native 依赖于 react@16.0.0-alp
react-native - React Native - react 原生架构
是否 react 原生应用程序开发可以通过软件架构实现，例如 MVC、MVP、MVVM ? 谢谢你。最佳答案是的。 React Native 只是你提到的那些软件设计模式中的“V”。如果你考虑其
react-native - React Native React 导航标题按钮事件
您好我正在尝试在我的导航器右按钮中绑定(bind)一个功能，但它给出了错误。这是我的代码: import React, { Component } from 'react'; import Ico
react-native - react-native\react.gradle'不存在
我使用react native创建了一个应用程序，我正在尝试生成apk。在http://facebook.github.io/react-native/docs/signed-apk-android.
react-select - React 选择下拉菜单位于 React 表分页下方
1 [我尝试将分页的 z-index 更改为 0，但没有成功] 这是我的codesandbox的链接:请检查最后一个选择下拉列表，它位于分页后面。 https://codesandbox.io/s/j
javascript - 从 'react' 导入 * 作为 React； vs 从 'react' 导入 React；
我注意到 React 可以这样导入: import * as React from 'react'; ...或者像这样: import React from 'react'; 第一个导入 react
react-native - react native 纸主题与 react 导航不起作用
我是 react-native 的新手。我正在使用 React Native Paper 为所有屏幕提供主题。我也在使用 react 导航堆栈导航器和抽屉导航器。首先，对于导航，论文主题在导航组件中不
react-native - React Native (React Navigation) 将数据从一个屏幕传递到另一个使用
我有一个使用 Ignite CLI 创建的 React Native 应用程序.我正在尝试将 TabNavigator 与 React Navigation 结合使用，但我似乎无法弄清楚如何将数据从一
react-testing-library - React 快照测试 - react-test-renderer 与 react-testing-library
我正在尝试在我的 React 应用程序中进行快照测试。我已经在使用 react-testing-library 进行一般的单元测试。然而，对于快照测试，我在网上看到了不同的方法，要么使用 react-
react-native - React Native - 嵌套导航器时 react 导航缓慢转换
我正在使用 react-native 构建跨平台 native 应用程序，并使用 react-navigation 在屏幕之间导航和使用 redux 管理导航状态。当我嵌套导航器时会出现问题。例如，
react-native - React Native 分页和 React 导航问题
由于分页和 React Native Navigation，我面临着一种复杂的问题。单击具有类别列表的抽屉，它们都将转到屏幕问题陈述: 当我随机点击类别时，一切正常。但是，在分页过程中遇到问题。假
react-native - 如何使用抽屉导航锁定特定页面的抽屉[ react 导航] [ react native ]
这是我的抽屉导航: const DashboardStack = StackNavigator({ Dashboard: { screen: Dashboard
react-native - react 原生构建失败 react-native-fbsdk
尝试构建 react-native android 应用程序但出现以下错误 info Running jetifier to migrate libraries to AndroidX. You ca
javascript - React Router 4 在 React、React DOM 和 React Router 使用外部时出现问题
我目前正在一个应用程序中实现 React Router v.4，我也在其中使用 Webpack 进行捆绑。在我的 webpack 配置中，我将 React、ReactDOM 和 React-route
javascript - React，react.children + react.cloneElement 在使用扩展运算符时中断
我正在使用 React.children 渲染一些带有 react router 的子路由(对于某个主路由下的所有子路由。这对我来说一直很好，但是我之前正在解构传递给 children 的 Prop
reactjs - 如何修复 "export ' React'(导入为 'React')在 'react' 中未找到“React js 错误”
当我运行 React 应用程序时，它显示 export 'React'(导入为 'React')在 'react' 中找不到。所有页面错误 see image here . 最佳答案根据图像中的错误
react-native - 不变违规 : ViewPagerAndroid has been removed from React Native .'react-native-viewpager' instead of 'react-native'
当我使用这个例子在我的应用程序上实现 Image-slider 时，我遇到了这个错误。 import React,{Component} from 'react' import {View,T

首页

博学

6Ren·AI

商城

python - 如何在多个 scrapy 蜘蛛在同一进程中运行时停止 react 堆