python - 获取 span 标签内 <a> 内的数据-6ren

python - 获取 span 标签内内的数据

转载作者：行者123 更新时间：2023-12-01 00:23:48

25

4

我坚持获取跨度标签内的所有数据。我的代码只给出了 span 标记内每个 a() 中的每个第一个值，并忽略其他值。在我的示例中:(注意，我减少了这里的跨度内容，但里面有很多内容)

<span class="block-niveaux-sponsors">
<a href="http://www.keolis.com/" id="a47-logo-part-keolis" target="_blank">
<img src="images/visuels_footer/footer/part_keolis.201910210940.jpg"/>
</a>
<div class="clearfix"></div>
</span>

<span class="block-niveaux-sponsors">
<a href="http://www.cg47.fr/" id="a47-logo-part-cg47" target="_blank">
<img src="images/visuels_footer/footer/part_cg47.201910210940.jpg"/>
</a>
<div class="clearfix"></div>
</span>

<span class="block-niveaux-sponsors">
<a href="http://www.errea.it/fr/" id="a47-logo-part-errea" target="_blank">
<img src="images/visuels_footer/footer/part_errea.201910210940.jpg"/>
</a>
<div class="clearfix"></div>
</span>

我的代码是:

page = urlopen(lien_suagen)
soup = bs(page, 'html.parser')
title_box_agen = soup.find_all('div', attrs={'id':'autres'})
for tag in title_box_agen:
    for each_row in tag.find_all('span'):
        links = each_row.find('a', href=True)
        title = links.get('id')
        print(title)

这只会给我 . 中的第一个 id 值。我想要所有的 ID。

最佳答案

你应该尝试:

page = urlopen(lien_suagen)
soup = bs(page, 'html.parser')
title_box_agen = soup.find_all('div', attrs={'id':'autres'})
for tag in title_box_agen:
    for each_row in tag.find_all('span'):
        links = each_row.find_all('a', href=True)
        for link in links:
            title = link.get('id')
            print(title)