gpt4 book ai didi

python - 如何从 url 下载文件并使用 python 请求保留其名称和元数据

转载 作者:太空宇宙 更新时间:2023-11-03 16:02:53 25 4
gpt4 key购买 nike

在浏览器中,如果我单击下载按钮,将下载一个文件及其原始名称和元数据。

目前,我可以使用 python 请求下载文件,但我必须为其指定名称,并且下载的文件中没有任何元数据可用。

我想要下载的文件具有有意义的名称,但这些名称不是网址的一部分。

使用 python 执行此操作的最佳方法是什么?

响应中只有这些 header :

  • 服务器
  • 日期
  • 内容类型
  • 连接
  • 变化
  • X-Powered-By
  • 编译指示
  • 设置 Cookie
  • 过期
  • 缓存控制
  • 链接
  • 内容编码

Content-Disposition header 在 r.headers 中不可用,但如果我在浏览器中下载文件,我可以看到它。

Traceback (most recent call last):
File "download.py", line 53, in <module>
print r.headers["Content-Disposition"]
File "/Users/raitis.dembovskis/.virtualenvs/webcrawler/lib/python2.7/site-packages/requests/structures.py", line 54, in __getitem__
return self._store[key.lower()][1]
KeyError: 'content-disposition'

最佳答案

只有当该 url 的 header 包含文件名信息时才能执行此操作:

result.urllib2.urlopen(url)
result.headers['content-disposition']
or
result.info()

关于python - 如何从 url 下载文件并使用 python 请求保留其名称和元数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40154027/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com