gpt4 book ai didi

python - 如何从标签内获取文本,但忽略其他子标签

转载 作者:行者123 更新时间:2023-12-02 03:32:24 25 4
gpt4 key购买 nike

我正在做漂亮的汤。我有一个 html 字符串:

<div><b>ignore this</b>get this</div>

如何检索“获取此”,同时忽略“忽略此

谢谢

最佳答案

您可以获取 div 文本,但无需递归检索子文本:

>>> from bs4 import BeautifulSoup
>>> soup = BeautifulSoup('<div><b>ignore this</b>get this</div>')
>>> soup.div.find(text=True, recursive=False)
u'get this'

这与文本相对于子项的位置无关:

>>> soup = BeautifulSoup('<div>get this<b>ignore this</b></div>')
>>> soup.div.find(text=True, recursive=False)
u'get this'

关于python - 如何从标签内获取文本,但忽略其他子标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27195569/

25 4 0