gpt4 book ai didi

python - 如何在Python Scrapy中的子div中使用特殊的src获取href

转载 作者:行者123 更新时间:2023-11-30 22:35:51 25 4
gpt4 key购买 nike

为了获取网站的所有图像,我编写了以下代码:

content = Selector(text = html)
all_images= content.css('img')
i = 0

for image in all_images:
src = image.css("::attr('src')").extract_first()

获取图像的 src 后,现在我想要每个图像的 href

<a href="/rayons/images" onclick="ga('send', 'event', 'computer HP', 'htwe', 'ope_xxl_s22Englos');">
<img src="/mySrc/" alt="something" class="ze-content">
</a>

当我知道 Src 时,如何获取 href

最佳答案

据我所知,您无法使用 CSS 进行父级搜索。在这种情况下,XPath 更适合。你可以这样做:

for image in all_images:
src = image.css("::attr('src')").extract_first()
href = image.xpath('parent::a/@href').extract_first()

或者,使用 XPath 的 abbreviated syntax :

href = image.xpath('../@href').extract_first()

关于python - 如何在Python Scrapy中的子div中使用特殊的src获取href,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44390810/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com