gpt4 book ai didi

google-cloud-storage - 使用 wget 等命令行实用程序从谷歌云存储下载公共(public)数据目录

转载 作者:行者123 更新时间:2023-12-03 19:32:15 24 4
gpt4 key购买 nike

我想从谷歌云存储下载公开可用的数据。但是因为我需要在Python3.x环境中,所以无法使用gsutil。我可以使用 wget 下载单个文件

wget http://storage.googleapis.com/path-to-file/output_filename -O 输出文件名

但是,像

wget -r --no-parent https://console.cloud.google.com/path_to_directory/output_directoryname -O 输出目录名

似乎不起作用,因为他们只是下载目录的索引文件。基于一些初始尝试的 rsync 或 curl 尝试也不会。知道如何将谷歌云存储上的公开数据下载为目录吗?

最佳答案

您上面提到的方法不起作用,因为 Google Cloud Storage 没有真正的“目录”。例如,“path/to/some/files/file.txt”是该对象的全名。一个类似命名的对象“path/to/some/files/file2.txt”恰好共享相同的命名前缀。

至于如何获取这些文件:GCS API(XML 和 JSON)允许您针对父存储桶进行对象列表,指定前缀;在这种情况下,您希望所有对象都以前缀“path/to/some/files/”开头。然后,您可以为响应正文中指定的每个对象发出单独的 HTTP 请求。话虽如此,您可能会发现通过其中一个 GCS 客户端库更容易做到这一点,例如 the Python library .

此外,gsutil 目前有 a GitHub issue open to track adding support for Python 3 .

关于google-cloud-storage - 使用 wget 等命令行实用程序从谷歌云存储下载公共(public)数据目录,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53265331/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com