gpt4 book ai didi

python - BeautifulSoup:搜索 .text 属性

转载 作者:行者123 更新时间:2023-12-01 08:29:22 25 4
gpt4 key购买 nike

我有以下情况

from bs4 import BeautifulSoup
html = '''<span class='generic'><span>Hey</span><span>Joe</span></span>'''
soup = BeautifulSoup(html, 'lxml')
tag = soup.find('span', text="HeyJoe")
print(tag)

打印None

但是如果我运行

soup.find('span', text="Hey").parent.text

它返回HeyJoe ,因此它返回“完整”文本,包括子级文本。我相信text= find()的参数函数还会搜索“完整”文本,即搜索 .text标签。

我必须找到家长span标签(具有类 generic 的标签)。

我想通过调用 BeautifulSoup 函数来搜索 .text 来做到这一点元素。这样它就会在搜索之前连接所有子标签中的文本。有这样的功能吗?

  1. 我无法使用该类来查找标签,因为在实际情况下,它是一个非常通用的类,被很多标签广泛使用
  2. 我不想寻找 children spanHey文本,然后检索父级,因为这在实际情况下也非常通用。

有没有办法搜索.text元素的属性?

最佳答案

您可以尝试使用下面的方法通过完整的文本内容查找span节点“HeyJoe”:

tag = [span for span in soup.findAll('span') if span.text == "HeyJoe"][0]

关于python - BeautifulSoup:搜索 .text 属性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53987945/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com