gpt4 book ai didi

python - 使用文本 selenium beautifulsoup python 获取标签

转载 作者:行者123 更新时间:2023-12-01 07:16:10 26 4
gpt4 key购买 nike

我知道有一种使用 xpath 和 javascript 的方法

    element = browser.find_element_by_xpath("//*[contains(text(),'text')]")

但此方法不会检测仅定义为标签的元素/标签,例如:

    <p>
<span class="text-primary">UK</span>
+44 (0) 1865 987 667<br>
Piccadilly Gardens, 49 Piccadilly, Manchester, M1 2AP </p>

在这种情况下,如果文本是+44 (0) 1865 987,则不会获取该元素。

  1. 这个问题在许多示例中都是重复的,以这种方式合并文本。可能是什么原因?
  2. 有没有办法在beautifulsoup中使用文本搜索来获取标签?

最佳答案

我的期望是您需要使用以下功能组合:

  1. normalize-space() - 在子项中查找匹配项/忽略前导/尾随空格等。
  2. contains() - 部分匹配

将所有内容放在一起:

element = driver.find_element_by_xpath("//*[contains(normalize-space(),'+44 (0) 1865 987 667')]")

演示:

enter image description here

更多信息:XPath Operators & Functions

关于python - 使用文本 selenium beautifulsoup python 获取标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57933543/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com