gpt4 book ai didi

html - Scrapy - 从具有特定属性值的链接中提取 href

转载 作者:太空宇宙 更新时间:2023-11-03 22:36:25 25 4
gpt4 key购买 nike

我正在使用 Scrapy。我有一个列表 a-carousel-card我要从第二个元素中提取 href。以下代码仅提取它找到的第一个链接。这些卡之间的唯一区别是 aria-posinset属性值为 "1" , "2"

response.css("li.a-carousel-card a::attr(href)").extract_first()

我非常不确定如何从列表中的第二个元素中提取 href。类似于 response.css("li.a-carousel-card a[aria-posinset="2"] a::attr(href)").extract_first() ,但这给了我“2”处的语法错误。

第一个元素是

<li class="a-carousel-card a-float-left" role="listitem" aria-setsize="100" aria-posinset="1" aria-hidden="false" style="margin-left: 14px;"> ,

另一个是

<li class="a-carousel-card a-float-left" role="listitem" aria-setsize="100" aria-posinset="2" aria-hidden="false" style="margin-left: 14px;">

两者之间的唯一区别是 aria-posinset 中的值:“1”和“2”。

我将如何完成这个?

最佳答案

您要么需要转义字符串中的双引号,要么需要使用单引号。您需要在下面使用

response.css("li.a-carousel-card[aria-posinset='2'] a::attr(href)").extract_first()

关于html - Scrapy - 从具有特定属性值的链接中提取 href,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46341640/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com