gpt4 book ai didi

python - 如何在不同的输入网站上同时多次运行 Scrapy 抓取工具并写入不同的输出文件?

转载 作者:太空宇宙 更新时间:2023-11-03 17:16:22 24 4
gpt4 key购买 nike

有谁知道我如何在不同的网站上运行同一个 Scrapy scraper 200 多次,每个网站都有各自的输出文件?通常在 Scrapy 中,当您从命令行运行它时,您可以通过键入 -o filename.json 来指示输出文件。

最佳答案

多种方式:

  • Create a pipeline删除具有可配置参数的项目,例如运行 scrapycrawl myspider -a output_filename=output_file.txt。 output_filename 作为参数添加到蜘蛛中,现在您可以从管道访问它,例如:

    class MyPipeline(object):
    def process_item(self, item, spider):
    filename = spider.output_filename
    # now do your magic with filename
  • 您可以run scrapy within a python script ,然后也用输出项做你的事情。

关于python - 如何在不同的输入网站上同时多次运行 Scrapy 抓取工具并写入不同的输出文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33639541/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com