gpt4 book ai didi

python-3.x - 如何高效提取这个类中最内在的内容?

转载 作者:行者123 更新时间:2023-12-04 09:02:49 25 4
gpt4 key购买 nike

我想替换 href 的值与类的内部值 lienarticle在下面的文字中

<a class="lienarticle" href="/dictionnaires/francais/aimer/1925">mono</a>
<a class="lienarticle" href="/dictionnaires/francais/aimer/1925"><i>aimer</i></a>
<a class="lienarticle" href="/dictionnaires/francais/aimer/1925"><b>you</b></a>
我实现目标的方法是基本的如下
from bs4 import BeautifulSoup

text = '''
<a class="lienarticle" href="/dictionnaires/francais/aimer/1925">mono</a>
<a class="lienarticle" href="/dictionnaires/francais/aimer/1925"><i>aimer</i></a>
<a class="lienarticle" href="/dictionnaires/francais/aimer/1925"><b>you</b></a>
'''

soup = BeautifulSoup(text, 'html.parser')

for a in soup.select('.lienarticle'):
a['href'] = 'entry://' + str(a.contents[0]).replace('<b>', '').replace('</b>', '').replace('<i>', '').replace('</i>', '')
想要的结果是
<a class="lienarticle" href="entry://mono">mono</a>
<a class="lienarticle" href="entry://aimer"><i>aimer</i></a>
<a class="lienarticle" href="entry://you"><b>you</b></a>
我想寻求一种更有效的方法来做到这一点,而不仅仅是将字符串替换为我的。非常感谢!

最佳答案

这是使用 .text 的一种方法方法
例如:

from bs4 import BeautifulSoup

text = '''
<a class="lienarticle" href="/dictionnaires/francais/aimer/1925">mono</a>
<a class="lienarticle" href="/dictionnaires/francais/aimer/1925"><i>aimer</i></a>
<a class="lienarticle" href="/dictionnaires/francais/aimer/1925"><b>you</b></a>
'''

soup = BeautifulSoup(text, 'html.parser')

for a in soup.select('.lienarticle'):
a['href'] = f'entry://{a.text}'
print(a)
输出:
<a class="lienarticle" href="entry://mono">mono</a>
<a class="lienarticle" href="entry://aimer"><i>aimer</i></a>
<a class="lienarticle" href="entry://you"><b>you</b></a>

关于python-3.x - 如何高效提取这个类中最内在的内容?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63526751/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com