gpt4 book ai didi

python - BeautifulSoup:如何用 span 标签替换内容

转载 作者:行者123 更新时间:2023-11-28 01:24:44 25 4
gpt4 key购买 nike

........<p style=" margin-top:12px; margin-bottom:0px; margin-left:0px; margin-right:0px; text-indent:0px;">textHere

<span style=" font-family:'Noto Sans';">ABC</span></p>

<p style=" margin-top:12px; margin-bottom:0px; margin-left:0px; margin-right:0px; text-indent:0px;"><span style=" font.......

我有一个像上面那样的 HTML。我需要

  1. 找到“Noto Sans”字体系列中的所有内容(它们总是在 span 标签内)
  2. 在不改变其余代码的情况下替换它们(A 为 X,B 为 Y 等......)

我试过的是这个,但不能正常工作。

from bs4 import BeautifulSoup
source_code = """.....<span style=" font-family:'Noto Sans';">ABC</span></p>......""
soup = BeautifulSoup(source_code, "lxml")

for re in soup.findAll('font', 'face' = "Noto Sans"):
print (re.replace("A", "X"))

有什么想法吗?

最佳答案

您需要找到所有包含 font-family: Noto Sansspan 标签,然后将 A 替换为 X 在您找到的每个 span 元素中:

import re

from bs4 import BeautifulSoup


source_code = """.....<span style=" font-family:'Noto Sans';">ABC</span></p>......"""
soup = BeautifulSoup(source_code, "lxml")

for elm in soup.find_all('span', style=re.compile(r"font-family:'Noto Sans'")):
elm.string = elm.text.replace("A", "X")

print(soup.prettify())

打印:

<span style=" font-family:'Noto Sans';">
XBC
</span>

关于python - BeautifulSoup:如何用 span 标签替换内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32567670/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com