gpt4 book ai didi

python - 如何用空白替换文本中提取的 HTML 标签?

转载 作者:太空宇宙 更新时间:2023-11-03 17:36:55 24 4
gpt4 key购买 nike

我正在从没有所有标签的 html 页面中提取文本(使用 Python 和 BeautifulSoup)。但是,标签不会被替换为空白。因此,例如,对于“blah blahDIVTAGblah”,我得到以下文本“blah blahblah”。如何在第二个和第三个内容之间插入空格?我正在使用以下代码。

# kill all script and style elements
for script in soup(["script", "style"]):
script.extract()

代码来自 BeautifulSoup Grab Visible Webpage Text

最佳答案

您可以使用.replace_with()简单地将标签替换为空白。 :

for script in soup(["script", "style"]):
script.replace_with(" ")

关于python - 如何用空白替换文本中提取的 HTML 标签?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31094011/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com