gpt4 book ai didi

python - 删除保持样式的 html(标签)部分 - python

转载 作者:太空宇宙 更新时间:2023-11-04 11:42:50 24 4
gpt4 key购买 nike

我想在保存之前删除包含特定字符串的 html 的一部分。该标签包含一个人的姓名,我想删除整个标签以使其匿名。

html 是:

<div id="top-card" data-li-template="top_card">...</div>

及其所有 child 。

我探索了使用 beautifulsoup 但找不到解决方案。

有没有一种方法可以在保持样式不变的情况下删除 html 的整个“部分”?

谢谢!

最佳答案

您可以使用 .extract()使用 BeautifulSoup 移除元素。

假设你想删除id为“top-card”的div:

>>> html = """
... <div id="top-card" data-li-template="top_card"><div>test</div></div>
... <div>test</div> <div id="foo">blah</div>"""
>>> soup = BeautifulSoup(html)
>>> [div.extract() for div in soup("div",id="top-card")]
[<div data-li-template="top_card" id="top-card"><div>test</div></div>]
>>> soup
<html><body>
<div>test</div> <div id="foo">blah</div></body></html>

关于python - 删除保持样式的 html(标签)部分 - python,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31183862/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com