gpt4 book ai didi

python - 如何通过 XPath 选择一个 div 而不是另一个 div 下的跨度?

转载 作者:太空宇宙 更新时间:2023-11-04 03:19:06 25 4
gpt4 key购买 nike

假设我有这个页面:

<div class="top">
<span class="strings">asdf</span>
<span class="strings">qwer</span>
<span class="strings">zxcv</span>
</div>

<div id="content">
some other text
<span class="strings">1234</span>
<span class="strings">5678</span>
<span class="strings">1234</span>
</div>

如何让脚本只抓取 div id="content" 中的 span 类字符串, div class="top"?结果应为“1234”、“5678”、“1234”。

到目前为止,这是我的代码:

from lxml import html
import requests
url = 'http://www.amazon.com/dp/B00SGGQRNO'
response = requests.get(url)
tree = html.fromstring(response.content)
bullets = tree.xpath('//span[@class="strings"]/text()')
print ('Bullets: ',bullets)

最佳答案

仅选择作为 div 元素子元素的那些 span 元素(使用 @class="strings")的文本@id="content,使用这个 XPath 表达式:

//div[@id="content"]/span[@class="strings"]/text()

关于python - 如何通过 XPath 选择一个 div 而不是另一个 div 下的跨度?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35248842/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com