gpt4 book ai didi

python - 使用 BeautifulSoup 从文本中删除标签

转载 作者:太空狗 更新时间:2023-10-29 14:00:37 25 4
gpt4 key购买 nike

这里有很多标题相似的问题,但我正在尝试从 soup 对象本身中删除标签。

我有一个页面,其中包含这个 div :

<div id="content">
I want to keep this<br /><div id="blah">I want to remove this</div>
</div>

我可以选择 <div id="content">soup.find('div', id='content')但我想删除 <div id="blah">从它。

最佳答案

您可以使用 extract如果您想从树中删除标签或字符串。

In [13]: soup = BeautifulSoup("""<div id="content">
I want to keep this<br /><div id="blah">I want to remove this</div>
</div>""")

In [14]: soup = BeautifulSoup("""<div id="content">
....: I want to keep this<br /><div id="blah">I want to remove this</div>
....: </div>""")

In [15]: blah = soup.find(id='blah')

In [16]: _ = blah.extract()

In [17]: soup
Out[17]:
<html><body><div id="content">
I want to keep this<br/>
</div></body></html>

关于python - 使用 BeautifulSoup 从文本中删除标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31451605/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com