gpt4 book ai didi

python - 删除另一个标签内的标签 beautifulsoup

转载 作者:行者123 更新时间:2023-12-01 01:55:30 25 4
gpt4 key购买 nike

u如何提取标签内的文本,如下所示:

<div><blockquote type="cite" class=""><p>Find me<\p>
<blockquote cite="mid:609415CB-0979-47C1-9A75-CE1BE65939A0@wiwacom.fr" type="cite" class=""><p>Not me<\p>
<blockquote type="cite" class=""><p>Not me too<\p>
</blockquote>
</blockquote>

我想要得到:

Find me

使用 python 和 beautifulsoup

最佳答案

您可以使用.find获取您所需的文本。

演示:

from bs4 import BeautifulSoup
s = """<div><blockquote type="cite" class=""><p>Find me</p>
<blockquote cite="mid:609415CB-0979-47C1-9A75-CE1BE65939A0@wiwacom.fr" type="cite" class=""><p>Not me<\p>
<blockquote type="cite" class=""><p>Not me too<\p>
</blockquote>
</blockquote></div>"""
soup = BeautifulSoup(s, "html.parser")
print(soup.find("div").find("p").text)

输出:

Find me

注意:您有一些无效的p标签 <\p> ==> </p>

关于python - 删除另一个标签内的标签 beautifulsoup,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50248527/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com