gpt4 book ai didi

python - 使用 lxml 检索类属性的名称

转载 作者:太空宇宙 更新时间:2023-11-04 15:00:34 25 4
gpt4 key购买 nike

我正在开发一个使用 lxml 来废弃页面的 python 项目,我面临着检索 span 类属性名称的挑战。 html 片段如下:

<tr class="nogrid">
<td class="date">12th January 2016</td>
<td class="time">11:22pm</td>
<td class="category">Clothing</td>
<td class="product">
<span class="brand">carlos santos</span>
</td>
<td class="size">10</td>
<td class="name">polo</td>
</tr>
....

如何在下面检索 span 的类属性的值:

<span class="brand">carlos santos</span>

最佳答案

您可以使用以下 XPath 获取 span 元素的 class 属性,该元素是 tdproduct< 的直接子元素 :

//td[@class="product"]/span/@class

工作演示示例:

from lxml import html
raw = '''<tr class="nogrid">
<td class="date">12th January 2016</td>
<td class="time">11:22pm</td>
<td class="category">Clothing</td>
<td class="product">
<span class="brand">carlos santos</span>
</td>
<td class="size">10</td>
<td class="name">polo</td>
</tr>'''

root = html.fromstring(raw)
span = root.xpath('//td[@class="product"]/span/@class')[0]
print span

输出:

Brand

关于python - 使用 lxml 检索类属性的名称,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35001376/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com