gpt4 book ai didi

python - 在python3中使用带有beautifulsoup的子字符串查找html标签

转载 作者:行者123 更新时间:2023-11-28 02:27:29 24 4
gpt4 key购买 nike

使用以下代码:

url ='http://lampspw.wallonie.be/dgo4/site_ipic/index.php/fiche/index?sortCol=2&sortDir=asc&start=0&nbElemPage=10&filtre=&codeInt=62121-INV-0018-02'
soup = BeautifulSoup(page.content, 'html.parser')
t = soup.find_all("div", attrs={'class':'panel-heading'})
lst = [x.text for x in t]

我得到:

['\xa0Filtres complémentaires',
'\xa0Recherche dans les notices',
'Libellé(s)\xa0',
'Illustration(s)',
'Localisation',...]

如果我直接在带有子字符串的 soup 中查找特定标签(包含在该列表中):

In [290]: soup.find_all("div", string=re.compile('Locali'))
Out[291]: [<div class="panel-heading">Localisation</div>]

我找回了我想要的前一个标签。但如果我这样做:

In :soup.find_all("div", string=re.compile('Libe'))
Out: []

有人可以解释一下这里的问题吗?我猜它位于 html 代码中,但我没有找到它...

最佳答案

感谢 kcorlidy:soup.find_all(string=re.compile('Libe')) 会得到结果

关于python - 在python3中使用带有beautifulsoup的子字符串查找html标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52986310/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com