gpt4 book ai didi

python - scrapy CSV 写作

转载 作者:太空宇宙 更新时间:2023-11-04 03:09:27 24 4
gpt4 key购买 nike

作为新用户,我设法制作了一个蜘蛛可以爬行的电子商务网站并提取每个产品的标题和变体以及输出的 CSV 文件和产品线,但我希望的是这是逐行的变化,请有人帮助我推进我的项目。

我很期待这个问题,但不幸的是我找不到答案。

我的蜘蛛:

import scrapy
from w3lib.html import remove_tags
from products_crawler.items import ProductItem


class DemostoreSpider(scrapy.Spider):
name = "demostore"
allowed_domains = ["adns-grossiste.fr"]
start_urls = [
'http://adns-grossiste.fr/17-produits-recommandes',
]
download_delay = 0.5

def parse(self, response):
for category_url in response.css('#categories_block_left > div > ul > li ::attr(href)').extract():
yield scrapy.Request(category_url, callback=self.parse_category, meta={'page_number': '1'})

def parse_category(self, response):
for product_url in response.css('#center_column > ul > li > div > div.right-block > h5 > a ::attr(href)').extract():
yield scrapy.Request(product_url, callback=self.parse_product)

def parse_product(self, response):
item = ProductItem()
item['url'] = response.url
item['title'] = response.css('#center_column > div > div.primary_block.clearfix > div.pb-center-column.col-xs-12.col-sm-7.col- md-7.col-lg-7 > h1 ::text').extract_first()
item['Déclinaisons'] = remove_tags(response.css('#d_c_1852 > tbody >tr.combi_1852.\31 852_155.\31 852_26.odd > td.tl.sorting_1 > a > span ::text').extract_first() or '')
yield item

样本 CSV 希望: image CSV

最佳答案

查看 official docummentation here

简而言之,有两种方法,最简单的方法就是使用爬网命令参数 --output-o 简而言之。例如:

scrapy crawl myspider -o myspider.csv

Scrapy 会自动将生成的项目转换为 csv 文件。有关更详细的方法,请查看开头发布的文档页面。

关于python - scrapy CSV 写作,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38553178/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com