gpt4 book ai didi

python - 如何从 XPath 中的类属性获取标题(Python/scrapy)

转载 作者:行者123 更新时间:2023-11-28 21:50:44 25 4
gpt4 key购买 nike

我正在努力从 tripadvisor 获取数据,但大多数第一个是相对日期,其余的是正常的 MM/DD/YYYY,但仔细检查我发现相对日期有这个

<span class="ratingDate relativeDate" title="20 June 2015">Reviewed 4 weeks ago
</span>

我正在使用这个 Xpath 来获取数据

response.xpath('//div[@class="col2of2"]//span[@class="ratingDate relativeDat
e" or @class="ratingDate"]/text()').extract()

我的问题是如何添加@title 以便获得具有正常日期格式的标题。

我试过了

response.xpath('//div[@class="col2of2"]//span[@class="ratingDate relativeDat
e"/@title or @class="ratingDate"]/text()').extract()

response.xpath('//div[@class="col2of2"]//span[@class="ratingDate relativeDat
e" or @class="ratingDate"]/@title/text()').extract()

最佳答案

在蜘蛛中弄清楚你必须做一个条件语句来动态检查 xpath 是否包含值。

这是我的演绎。

item['date'] = sel.xpath('//*[@class="ratingDate relativeDate"]/@title').extract()
item['date'] += sel.xpath('//div[@class="col2of2"]//span[@class="ratingDate"]/text()').extract()

关于python - 如何从 XPath 中的类属性获取标题(Python/scrapy),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31510643/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com