gpt4 book ai didi

Python 使用 BeautifulSoup 抓取图像

转载 作者:行者123 更新时间:2023-12-01 08:43:15 26 4
gpt4 key购买 nike

我正在尝试使用 BeautifulSoup 从网站上抓取和下载图像。我已经抓取了存储在 imgVal 中的链接列表,然后代码可以创建一个新目录来存储图像。我遇到的问题是代码只会从链接列表中下载一张图像。我想把它们全部下载下来。我怎样才能做到这一点?

from bs4 import BeautifulSoup
from os.path import basename
import requests
import os

...

def writeImages():
imgVal = getThumbnailLinks()
imgBasename = '\n'.join(map(str, imgVal))

pageNumber = '001'
filename = pageNumber + '/'
os.makedirs(os.path.dirname(filename), exist_ok=True)

with open(filename + basename(imgBasename),"wb") as f:
f.write(requests.get(imgBasename).content)

writeImages()

最佳答案

所以您想下载多行 URL 作为请求的输入?你不能,你必须使用循环来一一完成。

def writeImages():
pageNumber = '001'
filename = pageNumber + '/'
os.makedirs(os.path.dirname(filename), exist_ok=True)

imgVal = getThumbnailLinks() # ['http://a.jpg', 'http://b.jpg']
for imgBasename in imgVal:
with open(filename + basename(imgBasename),"wb") as f:
f.write(requests.get(imgBasename).content)

writeImages()

关于Python 使用 BeautifulSoup 抓取图像,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53413741/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com