gpt4 book ai didi

python - 使用 BeautifulSoup 修改 HTML

转载 作者:太空宇宙 更新时间:2023-11-04 08:45:46 24 4
gpt4 key购买 nike

我想使用 Beautifulsoup 修改 HTML 的整个 div。我试图修改 HTML,但是控制台输出有修改,但实际的 .html 文档本身没有修改。没有创建新的 HTML。

有人可以帮助我吗?

from bs4 import BeautifulSoup,Tag
import re
import urllib2
import os.path
base=os.path.dirname(os.path.abspath(__file__))

html=open(os.path.join(base,'example.html'))
soup=BeautifulSoup(html,'html.parser')


for i in soup.find('div',{"id":None}).findChildren():
l=str(i);
print l
print l.replace(l,'##')

最佳答案

两件事:

  1. 您需要添加一些代码以将 BeautifulSoup 的输出写回文件。
  2. 你应该使用replace_with()对 HTML 进行更改。通过转换为字符串,您只是在修改文本副本。

这可以按如下方式完成:

from bs4 import BeautifulSoup
import os

base = os.path.dirname(os.path.abspath(__file__))
html = open(os.path.join(base, 'example.html'))
soup = BeautifulSoup(html, 'html.parser')

for i in soup.find('div', {"id":None}).findChildren():
i.replace_with('##')

with open("example_modified.html", "wb") as f_output:
f_output.write(soup.prettify("utf-8"))

关于python - 使用 BeautifulSoup 修改 HTML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40775930/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com