gpt4 book ai didi

python - 使用 Python XPath 表达式提取文本

转载 作者:太空宇宙 更新时间:2023-11-03 15:29:24 25 4
gpt4 key购买 nike

我想显示http:///gb/groceries/easter-essentials--%28approx-205kg%29

scrapy 中我使用了这个 XPath 表达式:

response.xpath('//div[@class="productNameAndPromotions"]/h3/a/href').extract()

但是没有成功!

<div class="product ">
<div class="productInfo">
<div class="productNameAndPromotions">
<h3>
<a href="http:///gb/groceries/easter-essentials--%28approx-205kg%29">
<img src="http:co.uk/wcsstore7.20.1.145/ExtendedSitesCatalogAssetStore/image/catalog/productImages/08/020000008_L.jpeg" alt="" />
</a>
</h3>
</div>
</div>
</div>

最佳答案

这个//div[@class="productNameAndPromotions"]/h3/a/href表示您想要获取元素href,它是a的子元素.

如果你想提取节点的属性,例如href,需要使用@attribute语法。请尝试以下操作:

//div[@class="productNameAndPromotions"]/h3/a/@href

关于python - 使用 Python XPath 表达式提取文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43006084/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com