gpt4 book ai didi

python - 使用scrapy解析同一div下的网站

转载 作者:行者123 更新时间:2023-11-30 23:35:06 26 4
gpt4 key购买 nike

我需要使用scrapy解析一个网站。html页面模式如下

div class="nameinfo"     div class="namesub"           span class="namesub">/span>           span class="info">data of type 1 /span>     /div     div class="namesub">          span class="namesub">/span>          span class="info">data of type 2 /span>    /div>
div class="namesub"> span class="namesub">/span> span class="info">data of type 3 /span>> /div>/div
我有上面标记的三种不同类型的数据。知道如何获得所需的数据。它们全部位于 div 内的 span 元素中,类属性为“namesub”。提前致谢:)

最佳答案

这是您应该放入蜘蛛内部的内容:

hxs = HtmlXPathSelector(response)

namesubs = hxs.select("//div[@class='namesub']")
for namesub in namesubs:
item = MyItem()
item["info"] = namesub.select('.//span[@class="info"]/text()').extract()[0]

yield item

此代码假设您已使用 info 字段定义了 MyItem 项目类。

希望有帮助。

关于python - 使用scrapy解析同一div下的网站,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17548886/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com