gpt4 book ai didi

python - 网页抓取 bs4,无法弄清楚如何获得结果

转载 作者:太空宇宙 更新时间:2023-11-03 20:09:50 25 4
gpt4 key购买 nike

我目前正在尝试从以下位置抓取 title = "XFX" 值:

<a class="item-brand" href="https://www.newegg.com/XFX/BrandStore/ID-1669">
<img alt="XFX" class="lazy-img" data-effect="fadeIn" data-src="//c1.neweggimages.com/Brandimage_70x28//Brand1669.gif" src="//c1.neweggimages.com/WebResource/Themes/2005/Nest/blank.gif" title="XFX">
</img></a>

目前我正在使用这个python代码来访问它,但找不到它

brand_container = container.findAll("a", {"class":"item-brand"})
brand = brand_container[0].title

我不知道在brand = Brand_container之后放什么才能获得title =

最佳答案

标题属性位于image标签下,而不是anchor标签下。您可以使用find_all或css选择器select

from bs4 import BeautifulSoup
html='''<a class="item-brand" href="https://www.newegg.com/XFX/BrandStore/ID-1669">
<img alt="XFX" class="lazy-img" data-effect="fadeIn" data-src="//c1.neweggimages.com/Brandimage_70x28//Brand1669.gif" src="//c1.neweggimages.com/WebResource/Themes/2005/Nest/blank.gif" title="XFX">
</img></a>'''

container=BeautifulSoup(html,'html.parser')
brand_container = container.find_all("a", class_="item-brand")
for brand in brand_container:
print(brand.find_next('img')['title'])
<小时/>

CSS选择器

for brand in container.select(".item-brand>img"):
print(brand['title'])

关于python - 网页抓取 bs4,无法弄清楚如何获得结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58774250/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com