gpt4 book ai didi

python - 使用自定义scrapy imagePipeline下载图片并覆盖已有图片

转载 作者:太空宇宙 更新时间:2023-11-04 05:59:52 24 4
gpt4 key购买 nike

我正在练习使用 scrapy 通过自定义 imagePipeline 裁剪图像。我正在使用这个 code :

class MyImagesPipeline(ImagesPipeline):

def get_media_requests(self, item, info):
for image_url in item['image_urls']:
yield Request(image_url)

def convert_image(self, image, size=None):
if image.format == 'PNG' and image.mode == 'RGBA':
background = Image.new('RGBA', image.size, (255, 255, 255))
background.paste(image, image)
image = background.convert('RGB')
elif image.mode != 'RGB':
image = image.convert('RGB')

if size:
image = image.copy()
image.thumbnail(size, Image.ANTIALIAS)
else:
# cut water image TODO use defined image replace Not cut
x,y = image.size
if(y>120):
image = image.crop((0,0,x,y-25))

buf = StringIO()
try:
image.save(buf, 'JPEG')
except Exception, ex:
raise ImageException("Cannot process image. Error: %s" % ex)

return image, buf

它运行良好但有问题。
如果文件夹中有原始图像,然后运行蜘蛛,
它下载的图像不会替换原始图像。

如何让它覆盖原始图像?

最佳答案

有一个expiration setting ,默认为 90 天。

关于python - 使用自定义scrapy imagePipeline下载图片并覆盖已有图片,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25658391/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com