gpt4 book ai didi

python - 如何提取抓取图像的文件修改时间?

转载 作者:行者123 更新时间:2023-11-28 17:04:08 35 4
gpt4 key购买 nike

我正在尝试抓取包含零件图像的零件网站的一部分,以收集一些统计信息。但是,没有 url 或图像上传或创建日期,所以我必须使用大概的图像文件 modification-date 来获取此信息。使用 cURL,这是一项简单的任务:

curl -sI https://path.to.com/blahblah_123/item_picture.jpg |grep "last-modified"

但是,我认为在 scrapy 蜘蛛中获取它会更方便。但我不知道 scrapy 是否支持这个,因为我在文档中找不到它。

有没有办法在 scrapy 中获取抓取图像的最后修改日期?

最佳答案

来自 Scrapy 的文档, response 有一个 headers 字典字段。

因此您可以使用 response.headers.get('Last-Modified') 访问 last-modified

关于python - 如何提取抓取图像的文件修改时间?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52365494/

35 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com