gpt4 book ai didi

Python - 编辑本地 HTML 文件 - 我应该将所有内容编辑为一个字符串还是逐行编辑为一个数组?

转载 作者:行者123 更新时间:2023-11-28 01:52:58 25 4
gpt4 key购买 nike

需要说明的是,这不是一个抓取问题。

我正在尝试自动编辑类似的 HTML 文件。这涉及删除标签之间的内容。

在本地编辑 HTML 文件时,open() 文件然后将内容逐行转储到字符串中是否更容易应用正则表达式?

谢谢

最佳答案

对于像 HTML 这样的结构化标记,最好使用像 BeautifulSoup 这样的解析器。比正则表达式。这样做的几个原因包括更好地处理格式错误的 HTML 和降低复杂性(您不需要重新发明轮子)。

尽管从表面上考虑这个问题,使用 readlines 将 HTML 拆分成行似乎更容易这样您在应用正则表达式时一次只处理一行。

关于Python - 编辑本地 HTML 文件 - 我应该将所有内容编辑为一个字符串还是逐行编辑为一个数组?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18986290/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com