gpt4 book ai didi

python - Scrapy 从 div 中获取 href

转载 作者:太空宇宙 更新时间:2023-11-03 12:20:45 24 4
gpt4 key购买 nike

开始用Scrapy做一个小项目,提取链接失败。每次找到类(class)时,我只得到“[]”而不是 url。我是否遗漏了一些明显的东西?

sel = Selector(response)
for entry in sel.xpath("//div[@class='recipe-description']"):
print entry.xpath('href').extract()

网站示例:

<div class="recipe-description">
<a href="http://www.url.com/">
<h2 class="rows-2"><span>SomeText</span></h2>
</a>
</div>

最佳答案

你的xpath查询有误

for entry in sel.xpath("//div[@class='recipe-description']"):

在这一行中,您实际上是在迭代没有任何 Href 属性的 div

为了使其正确,您应该在 div 中选择 achor 元素:

for entry in sel.xpath("//div[@class='recipe-description']/a"):
print entry.xpath('href').extract()

最好的解决方案是直接在 for 循环中提取 href 属性

for href in sel.xpath("//div[@class='recipe-description']/a/@href").extract():
print href

为简单起见,您还可以使用 css 选择器

for href in sel.css("div.recipe-description a::attr(href)").extract():
print href

关于python - Scrapy 从 div 中获取 href,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36281413/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com