gpt4 book ai didi

具有特定搜索深度嵌套的 Python lxml XPath

转载 作者:行者123 更新时间:2023-11-28 22:02:53 25 4
gpt4 key购买 nike

我希望提取的文本的 xpath 可靠地位于树的深处

...table/tbody/tr[4]/td[2]

具体来说,td[2] 的结构是这样的

<td class="val">xyz</td>

我正在尝试提取文本“xyz”,但广泛的搜索会返回多个结果。例如,以下路径返回 10 个元素。

xpath('//td[@class="val"]')

... 而特定搜索不返回任何元素。 我不确定为什么以下内容不返回任何内容。

xpath('//tbody/tr/td[@class="val"]')

一个解决方案涉及..

table = root.xpath('//table[@class="123"]')

#going down the tree
xyz = table[0][3][1]
print vol.text

但是,我很确定这非常脆弱。如果有人能告诉我如何构建既不脆弱又资源相对便宜的 xpath 搜索,我将不胜感激

最佳答案

你没有明确提到它,但如果你的目标 tabletd 标签类是可靠的,那么你可以做类似的事情:

//table[@class="123"]/descendant::td[@class="val"]

而你一半回避了 tbody 是否存在的问题。

但是,除了实际查看您正尝试解析的 Material 以推荐 XPATH 查询之外,没有什么可以替代...

关于具有特定搜索深度嵌套的 Python lxml XPath,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10418958/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com