gpt4 book ai didi

python HTMLParser 替换html文件数据中的一些字符串

转载 作者:行者123 更新时间:2023-12-04 06:15:12 27 4
gpt4 key购买 nike

我需要在我的 html 页面的数据内容中替换一些字符串。我不能直接使用替换功能,因为我只需要更改数据部分。它不应修改任何标签或属性。我用过 HTMLParser为了这。但我坚持把它写回文件。使用 HTMLParser我可以解析并获取数据内容,我将对其进行必要的更改。但是如何把它放回我的 html 文件?

请帮忙。这是我的代码:

class EntityHTML(HTMLParser.HTMLParser):
def __init__(self, filename):
HTMLParser.HTMLParser.__init__(self)
f = open(filename)
self.feed(f.read())

def handle_starttag(self, tag, attrs):
"""Needn't do anything here"""
pass

def handle_data(self, data):
print data
data = data.replace(",", "&sbquo")

最佳答案

HTMLParser不会在您的 html 文件的内存中构建任何表示。您可以在 handle_*() 中自己做方法,但更简单的方法是使用 BeautifulSoup :

>>> import re
>>> from BeautifulSoup import BeautifulSoup
>>> soup = BeautifulSoup('<a title=,>,</a>')
>>> print soup
<a title=",">,</a>
>>> comma = re.compile(',')
>>> for t in soup.findAll(text=comma): t.replaceWith(t.replace(',', '&sbquo'))
>>> print soup
<a title=",">&sbquo</a>

关于python HTMLParser 替换html文件数据中的一些字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7339042/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com