gpt4 book ai didi

web-scraping - 如何在 BeautifulSoup 中只获取标签的内部文本,不包括嵌入的?

转载 作者:行者123 更新时间:2023-12-04 04:45:04 25 4
gpt4 key购买 nike

例如,

<ul>
<li>
<b>Hey, sexy!</b>
Hello
</li>
</ul>

我只想要 li 标记中的“Hello”。

如果我使用 soup.find("ul").li.text 它也包含 b 标签。

最佳答案

您可以使用 find像这样的功能

from bs4 import BeautifulSoup

html = '''<ul><li><b>Hey, sexy!</b>Hello</li></ul>'''
soup = BeautifulSoup(html)
print soup.find('li').find(text=True, recursive=False)

关于web-scraping - 如何在 BeautifulSoup 中只获取标签的内部文本,不包括嵌入的?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28685753/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com