gpt4 book ai didi

python - 通过脚本运行 Scrapy spider & 配置输出文件的设置

转载 作者:行者123 更新时间:2023-11-28 16:39:12 25 4
gpt4 key购买 nike

我用 scrapy 编写了一个蜘蛛并在 python 脚本中运行它(不是 scrapy cmd 提示符)。我想配置设置,以便在特定文件(比如 output.json)中获取报废数据。

如果我在提示符下运行以下命令,我可以得到结果:“scrapy crawl myspider -o scrapedData.json -t json”

但我希望通过运行脚本而不是通过 cmdline 工具获得相同的输出。

感谢您的帮助!

最佳答案

settings = get_project_settings()
settings.overrides['FEED_URI'] = 'dealsOutput.json'
settings.overrides['FEED_FORMAT'] = 'json'

spider = dealsSpider()
crawler = Crawler(settings)

我通过查看这段代码发现:https://github.com/scrapy/scrapy/blob/master/scrapy/commands/crawl.py#L34

关于python - 通过脚本运行 Scrapy spider & 配置输出文件的设置,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21854251/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com