gpt4 book ai didi

python - 从特定标签 BeautifulSoup/Python 中删除样式

转载 作者:太空宇宙 更新时间:2023-11-04 16:30:09 25 4
gpt4 key购买 nike

假设我有一份汤,我想删除所有段落的所有样式标签。所以我想转<p style='blah' id='bla' class=...><p id='bla' class=...>在整个汤里。但我不想碰,比方说,<img style='...'>标签。我该怎么做?

最佳答案

想法是使用 find_all('p') 遍历所有 p 标签并删除样式属性:

from bs4 import BeautifulSoup


data = """
<body>
<p style='blah' id='bla1'>paragraph1</p>
<p style='blah' id='bla2'>paragraph2</p>
<p style='blah' id='bla3'>paragraph3</p>
<img style="awesome_image"/>
</body>"""


soup = BeautifulSoup(data, 'html.parser')
for p in soup.find_all('p'):
if 'style' in p.attrs:
del p.attrs['style']

print soup.prettify()

打印:

<body>
<p id="bla1">
paragraph1
</p>
<p id="bla2">
paragraph2
</p>
<p id="bla3">
paragraph3
</p>
<img style="awesome_image"/>
</body>

关于python - 从特定标签 BeautifulSoup/Python 中删除样式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22497545/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com