gpt4 book ai didi

python - Xpath 用于使用类查找 anchor 标记内的文本(Scrapy)

转载 作者:行者123 更新时间:2023-12-01 08:16:43 25 4
gpt4 key购买 nike

我正在尝试使用Xpath提取Anchor Tag的链接

网址

<a class="text size-1x-small font-accent color-brand all-caps"
href="http://time.com/section/business"
data-reactid="199">
Business
</a>

代码

item["category"] = str(
response.xpath(
'//a[@class="text size-1x-small font-accent color-brand all-caps"]/text()'
).extract()
)

以及Python函数

def parseSave(self, response):
item = NYtimesItem()
item["category"] = response.xpath(
'//a[@class="text size-1x-small font-accent color-brand all-caps"]/text()'
).extract()

yield item

请告诉我我做错了什么预期的输出将是 anchor 标记的文本。例如商业

最佳答案

/text() 旨在获取元素的内部文本。要提取 href 属性,请改用 /@href

Here is a handy xpath cheatsheet

关于python - Xpath 用于使用类查找 anchor 标记内的文本(Scrapy),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54942552/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com