gpt4 book ai didi

python - Xpath 规范化空间

转载 作者:太空宇宙 更新时间:2023-11-03 14:30:04 26 4
gpt4 key购买 nike

我感觉很蠢。 Python 和 xpath 新手在这里。我正在尝试提取完整的文本 'Open Box Price: $1079.99'使用 xpath 来自

<div class="prod-price">
<p class="opbox-price">
<strong> Open Box Price:<br>$1079.99</strong>
</p>
<p class="orig-price">
Regular Price: <strong>$1499.98</strong>
</p>
</div>

但是我不能。文本停在 <br> .这是我的代码

doc = lxml.html.fromstring(r.content)
elements = doc.xpath(item_xpath)
print elements[1].find('div[3]/p[1]/text()[normalize-space()]')

最佳答案

您想要的 XPath 的基础是使用 descendant-or-self - 根据您的需要调整结果:

>>> doc.xpath('//p[1]/descendant-or-self::text()')
['\n ', ' Open Box Price:', '$1079.99', '\n ']
>>> doc.xpath('//p[2]/descendant-or-self::text()')
['\n Regular Price: ', '$1499.98', '\n ']

或者当您使用 lxml.html 时,您可以使用 text_content()

paras = doc.xpath('//p'): # or findall etc...
for para in paras:
print para.text_content()

关于python - Xpath 规范化空间,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12964996/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com