gpt4 book ai didi

python - 如何访问标签内的标签(获取标签文本等值)?如何获取(段落)p 标签内 h1 标签的值?

转载 作者:太空宇宙 更新时间:2023-11-04 01:56:35 27 4
gpt4 key购买 nike

我正在使用 Selenium 和 Python 来解决一个问题。我想提取段落内的信息(p 标签)。我正在使用“find_elements_by_tag_name”来定位页面中的所有 p 标签。但是我怎样才能访问该段落中已经存在的一些标签。例如,有一个 html 文件,其代码如下

<p> This is a paragraph <h1> but this is a h1 tag </h1></p>

我已经用selenium打开了这样的页面

br=webdriver.Chrome()
br.get('file:///C:/Users/Shady/Desktop/New%20Text%20Document.html')

我可以通过

访问 P 标签的元素
p_tags=br.find_elements_by_tag_name('p')

它只显示一个元素,当我显示时

print(x[0].text)

它只显示

This is a paragraph

如何访问 p 标签内的 h1 标签。 X_path 可以吗?如果是,能否请您分享代码?

最佳答案

<h1>标签实际上是 <p> 的后代标签。所以在你的代码试验中你已经确定了 <p>标记并提取正确给出 This is a paragraph 的文本。

所以要提取文本但这是一个h1 标签 你必须到达后代<h1>您可以使用以下任一项 Locator Strategies :

  • 使用 css_selector :

    print(driver.find_element_by_css_selector("p>h1").get_attribute("innerHTML"))
  • 使用 xpath :

    print(driver.find_element_by_xpath("//p/h1").get_attribute("innerHTML"))

关于python - 如何访问标签内的标签(获取标签文本等值)?如何获取(段落)p 标签内 h1 标签的值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56682904/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com