gpt4 book ai didi

web-crawler - Scrapy上下文中的scraper、crawler和spider的区别

转载 作者:行者123 更新时间:2023-12-04 11:49:38 28 4
gpt4 key购买 nike

试图阅读 Scrapy 的代码。 scaper、crawler 和 spider 这三个词令人困惑。例如

scrapy.core.scraper
scrapy.crawler
scrapy.spiders

谁能在 Scrapy 的上下文中解释这些术语的含义和区别?提前致谢。

最佳答案

爬虫 ( scrapy.crawler ) 是 Scrapy API 的主要入口点。它提供对所有 Scrapy 核心组件的访问,并用于将扩展功能 Hook 到 Scrapy。

抓取刀 ( scrapy.core.scraper ) 组件负责解析响应并从中提取信息。它是从引擎运行的,它被用来运行你的蜘蛛。

scrapy.spiders 是一个包含基础 Spider 的模块实现(用于编写爬虫),以及一些开箱即用的常见爬虫(例如用于基于规则集的爬虫的 CrawlSpider、用于基于站点地图的爬虫的 SitemapSpider 或用于爬取 XML 提要的 XMLFeedSpider)。

更多信息可在官方文档页面上找到:
http://doc.scrapy.org/en/latest/topics/spiders.html?highlight=crawlspider#spiders
http://doc.scrapy.org/en/latest/topics/api.html?highlight=scrapy.crawler#module-scrapy.crawler

关于web-crawler - Scrapy上下文中的scraper、crawler和spider的区别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34260886/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com