gpt4 book ai didi

python - 如何获取第二个 "span"? (用Python制作网络爬虫)

转载 作者:太空宇宙 更新时间:2023-11-03 21:19:13 25 4
gpt4 key购买 nike

我是 python 新手,正在构建一个网络爬虫。我想要整个网页上第二个“跨度”的所有实例。我的目标是获取所有汽车品牌名称(例如:Nissan)和汽车型号名称(例如:Pathfinder)

但我不知道如何获取所有车型。我尝试过建立索引,但无法创建一个给出所有模型名称的循环。

下面是我想从中获取名称的页面 html。

   <h3 class="brandModelTitle">
<span class="txtGrey3">NISSAN</span>
<span class="txtGrey3">PATHFINDER</span>

<span class="version txtGrey7C noBold">(2)
2.5 DCI 190 LE 7PL EURO5</span>

</h3>

下面是我用来查找所有品牌名称的代码名称 = []

Prices_Cars = []
for var1 in soup.find_all('h3', class_ = 'brandModelTitle'):
brand_Names = var1.span.text
Names.append(brand_Names)

最佳答案

你可以使用scrapy,我只包含解析函数部分:

def parse(self, response):
#Remove XML namespaces
response.selector.remove_namespaces()

#Extract article information
brands = response.xpath('//h3/span[1]/text()').extract()
models = response.xpath('//h3/span[2]/text()').extract()
details = response.xpath('//h3/span[3]/text()').extract()


for item in zip(brands,models,details):
scraped_info = {
'brand' : item[0],
'model' : item[1],
'details' : item[2]
}

yield scraped_info

scrapy信息:https://www.analyticsvidhya.com/blog/2017/07/web-scraping-in-python-using-scrapy/xpath 示例:https://www.w3schools.com/xml/xpath_examples.asp

关于python - 如何获取第二个 "span"? (用Python制作网络爬虫),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54436117/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com