gpt4 book ai didi

python - 使用 lxml 替换 HTML 标签并保留其内容

转载 作者:太空宇宙 更新时间:2023-11-03 18:08:38 25 4
gpt4 key购买 nike

我有一些 html 内容(没有 html、body 和 head 等标签)。我需要做的是从标签中去除样式信息,并将 div 标签替换为 p 标签。

我使用条纹样式信息:

from lxml.html.clean import Cleaner
return Cleaner(style=True).clean_html(html)

如何用 p 标签替换 div 标签,同时保留 div 标签的内容(div 标签的内容应位于新的 p 标签中)。

最佳答案

html = html.replace("<div>", "<p>")
html = html.replace("</div>", "</p>")

您可以使用成熟的 HTML 解析和生成来完成此操作,但上面的方法可能可以做到这一点。

关于python - 使用 lxml 替换 HTML 标签并保留其内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26381958/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com