gpt4 book ai didi

beautifulsoup - BeautifulSoup 。如何获取包含特定单词的链接?

转载 作者:行者123 更新时间:2023-12-05 03:57:05 37 4
gpt4 key购买 nike

HTML 在 div 中包含字符串:

  • 'div class="slide"' 'img src="xttps://site.com/files/r_1000,kljg894/43k5j/35h43jkl.jpg' '/div'
  • 'div class="slide"' 'img src="xttps://site.com/files/r_2000,kljg894/43k5j/35h43jkl.jpg' '/div'
  • 'div class="slide"' 'img src="xttps://site.com/files/r_3000,kljg894/43k5j/35h43jkl.jpg' '/div'

需要获取一个只包含“r_3000”的链接

此代码获取所有链接:

imglink = soup.find_all('img')
print(imglink)

我浏览并尝试了很多技巧。例如:

('img', string="*r_3000*"), ('img', string=re.compile('r_3000') ('img', string=lambda s: 'r_3000' in s) 和许多其他的,但这一切都不起作用:(

请帮帮我

最佳答案

有很多方法可以做到这一点。试试 css 选择器。

from bs4 import BeautifulSoup
html='''<div class="slide"><img src="xttps://site.com/files/r_1000,kljg894/43k5j/35h43jkl.jpg"></div>
<div class="slide"> <img src="xttps://site.com/files/r_2000,kljg894/43k5j/35h43jkl.jpg"></div>
<div class="slide"><img src="xttps://site.com/files/r_3000,kljg894/43k5j/35h43jkl.jpg"></div>'''
soup=BeautifulSoup(html,"html.parser")
for item in soup.select("img[src*='r_3000']"):
print(item['src'])

关于beautifulsoup - BeautifulSoup 。如何获取包含特定单词的链接?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58822433/

37 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com