gpt4 book ai didi

python - 如何用Python中的美丽汤替换html页面中的特定文本行

转载 作者:太空宇宙 更新时间:2023-11-03 17:53:29 25 4
gpt4 key购买 nike

我对漂亮的汤python完全是新手。

我正在尝试替换下面的行

Assurez-vous de bien recevoir tous nos messages en ajoutant tribeca@yes.net a votre carnet d'adresses.

yaya toure

我已经完成了这段代码(见下文)

from BeautifulSoup import BeautifulSoup   
import re

url = r"/cygdrive/d/ope_mdl/bsoup/test_toto.html"
page = open(url)
soup = BeautifulSoup(page.read())

soup.replace('Assurez-vous de bien recevoir tous nos messages en ajoutant tribeca@yes.net a votre carnet d\'adresses.', 'Yaya Toure')

如您所见,votre carnet d'adresses. 已经有一个 '。我已经放置了 \

但是,它似乎并没有取代文本。

我做错了什么?

编辑:第 1 行到第 5 行工作正常。您必须在本地驱动器中创建一个 HTML 文件。只有第 6 行给我带来了问题。

最佳答案

我似乎找不到BeautifulSoup.replace在 pydoc 中。所以我相信你不应该在你的代码中使用它。所以不要使用

search_text = 'Assurez-vous de bien recevoir tous nos messages en ajoutant tribeca@yes.net a votre carnet d\'adresses.'
soup.find(text=lambda x: x.startswith(search_text)).replaceWith('Yaya Toure')

编辑:请注意,我们必须将函数作为文本参数传递,因为您的特定 html 文件的搜索字符串被更多带有 <br /> 的文本分隔开。在文本的中间。这会导致文本属性成为您想要的字符串和垃圾数据的串联。

关于python - 如何用Python中的美丽汤替换html页面中的特定文本行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28813439/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com