gpt4 book ai didi

python - 获取指向包含某些文本的标签的xpath

转载 作者:行者123 更新时间:2023-12-03 16:49:40 24 4
gpt4 key购买 nike

我正在尝试找到网页上某些文本的xpath。如果您要转到https://www.york.ac.uk/teaching/cws/wws/webpage1.html并尝试获取“ EXERCISE”的xpath,则它看起来像“ html body html table tbody tr td div h4”。如果转到该页面,请右键单击“ EXERCISE”并检查它,您可以在代码底部(chrome)中看到该路径。

我尝试了许多路径。没有一个能得到理想的结果。这是我得到的最接近的:

soup = BS(page, 'html.parser')
tags = [{"name":tag.name,"text":tag.text,"attributes":tag.attributes} for tag in soup.find_all()]
s = ''
for t in tags:
if "EXERCISE" in t['text']:
s = s + t['name'] + " "
print(s)


首先,我需要获取“ html body html table tbody tr td div h4”,但最终在页面更复杂的情况下,我还需要获取标签属性

谢谢!

最佳答案

使用lxml:

输出:/ html / body / html / table / tr / td / div [2] / h4

关于python - 获取指向包含某些文本的标签的xpath,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57297248/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com