gpt4 book ai didi

python - 使用 scrapy 抓取一页

转载 作者:太空宇宙 更新时间:2023-11-03 16:31:42 25 4
gpt4 key购买 nike

我有一个很长的 URL 流,需要抓取和提取数据,我想使用 scrapy。

假设我有一个 Twisted react 堆设置并创建了蜘蛛

runner = CrawlerRunner(scrapy_settings)
d = runner.crawl(spider_cls)

有没有办法可以将 URL 发送给蜘蛛,以便它对其进行处理?

最佳答案

crawl() method可以接受额外的参数:

d = runner.crawl(spider_cls, start_urls=["url"])

关于python - 使用 scrapy 抓取一页,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37554029/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com