gpt4 book ai didi

python - Xpath获取标签后的文本

转载 作者:行者123 更新时间:2023-11-28 00:02:06 27 4
gpt4 key购买 nike

我想根据他们的(前面的)<label> 获取元素属性,像这样:

 <div>
<ul>
<li class="phone">
<label>Mobile</label>
312-999-0000
<div>
<ul>
<li class="phone">
<label>Home</label>
312-999-0001

我想将第一个号码放在“移动”列/列表中,将第二个号码放在家庭列表中。我目前有抓取它们的代码,但我不知道获取标签的正确语法,因为它在源代码中。这是我现在使用的:

for target in targets:
item = CrawlerItem()
item['phonenumbers'] = target.xpath('div/ul/li[@class="phone"]/text()').extract()

我应该如何使用标签为 item['mobilephone'] 和 item['homephone'] 重写?

最佳答案

我在做题的时候找到了答案,觉得应该分享一下:

item['mobilephone'] = target.xpath('div/ul/li/label[contains (text(),"Mobile")]/following-sibling::text()').extract()
item['officephone']= target.xpath('div/ul/li/label[contains (text(),"Office")]/following-sibling::text()').extract()

关于python - Xpath获取标签后的文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20793908/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com