python - 如何列出给定 GCS 存储桶中的所有顶级文件夹？-6ren

python - 如何列出给定 GCS 存储桶中的所有顶级文件夹？

转载作者：行者123 更新时间：2023-12-01 06:39:22

25

4

我从

开始

    client = storage.Client()
    bucket = client.get_bucket(BUCKET_NAME)

    <what's next? Need something like client.list_folders(path)>

我知道如何:

列出 bucket.list_blobs() 的所有 Blob(包括任意深度的子子子文件夹中的 Blob)
或者如何使用 bucket.list_blobs(prefix=<path to subfolder>) 递归列出给定文件夹中的所有 blob

但是如果我的文件系统结构有100怎么办？顶级文件夹，每个文件夹都有数千个文件。任何有效的方法只获得那些100顶级文件夹名称而不列出所有内部 blob？

最佳答案

这里的所有响应都有一个答案，但您需要组合:前缀、分隔符和前缀加载的 list_blobs(...) 迭代器。让我写下获取 100 个顶级文件夹的代码，然后我们将逐步介绍它。

import google.cloud.storage as gcs
client = gcs.Client()
blobs = client.list_blobs(
    bucket_or_name=BUCKET_NAME, 
    prefix="", 
    delimiter="/", 
    max_results=1
)
next(blobs, ...) # Force list_blobs to make the api call (lazy loading)
# prefixes is now a set, convert to list
print(list(blobs.prefixes)[:100])

在前八行中，我们构建 GCS 客户端并进行 client.list_blobs(...) 调用。在您的问题中，您提到了 bucket.list_blobs(..) 方法 - 从版本 1.43 开始，这仍然有效，但是 the page on Buckets in the docs说这现在已被弃用。唯一的区别是第 4 行的关键字 arg bucket_or_name。

我们希望文件夹位于顶层，因此我们实际上根本不需要指定前缀，但是，对于其他读者来说，如果您想列出文件夹，这将很有用在顶级目录 stuff 中，那么您应该指定尾部斜杠。这个 kwarg 将变成 prefix="stuff/"。

有人已经提到了 delimiter kwarg，但是为了迭代，您应该指定它，以便 GCS 知道如何将 blob 名称解释为目录。足够简单。

max_results=1 是为了提高效率。请记住，我们在这里不需要 blob，我们只需要文件夹名称。因此，如果我们告诉 GCS 一旦发现单个 Blob 就停止寻找，它可能会更快。在实践中，我还没有发现这种情况，但如果你有大量的 Blob ，或者存储是冷线或其他什么，很可能会出现这种情况。 YMMV。考虑它是可选的。

返回的 blob 对象是一个延迟加载迭代器，这意味着它不会加载(甚至不会填充其成员)，直到进行第一个 api 调用。为了获得第一次调用，我们要求迭代器中的 next 元素。就您而言，您知道您至少有一个文件，因此只需调用 next(blobs) 即可。它获取队列中的下一个(位于行的前面)的 blob，然后将其丢弃。

但是，如果您不能保证至少有一个 blob，则需要从迭代器返回某些内容的 next(blobs) 将引发 StopIteration异常(exception)。为了解决这个问题，我们设置了省略号的默认值 ...。

现在我们想要的 blob 成员 prefixes 已加载，我们打印出前 100 个。输出将类似于:

{'dir0/','dir1/','dir2/', ...}

关于python - 如何列出给定 GCS 存储桶中的所有顶级文件夹？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59526251/

25

4

0

文章推荐： python - 约束优化问题: Python

文章推荐： php - Ajax 大问题..无法解决

文章推荐： python - 使用Python从视频中识别车牌

netbeans - NetBeans 6.8添加了“添加JAR/文件夹”文件夹，但该软件包不存在
我在使用NetBeans 6.8时遇到以下问题。我通过项目属性->库->编译选项卡->添加JAR /文件夹添加带有jar的文件夹。在下一个窗口中，我选择文件夹，然后选择“复制到库文件夹”。但是，我仍然
url-rewriting - Web.config 将一个域重定向到非 https 文件夹，将另一个域重定向到 https 文件夹
我的网站有一个域别名。我想知道如何将 domainA.ext 的请求重定向到 https://domainA.ext/folderA和对 domainB.ext 的请求到 http://domainB
Android 创建自定义菜单(和自定义 res/menu 文件夹，没有 res/menu 文件夹)
我应该在 Eclipse 中构建的 Android 项目中创建自己的自定义菜单文件夹吗？例如，我想创建一种出现在所有 Activity 中的标题。我知道菜单应该在 res/menu 文件夹中的 XML
asp.net-mvc - 如何设置或指定 ASP.NET MVC 使用的 Controllers 文件夹，而不是默认的 Controllers 文件夹？
我正在使用 VS2008 和 .net 3.5。我在我的解决方案中创建了一个类库(Myproject.Controllers)。在这个类下，我添加了一个 Controllers 文件夹。在文件夹中我添
visual-studio-2012 - 如何在 VS2012 构建后步骤中获取 Visual Studio 2012 AddIns 文件夹(或当前用户的 "Documents"文件夹)？
我有一个包含生成后步骤的 Visual Studio 2012 扩展项目，我想在其中将 .dll 和 .AddIn 文件复制到当前用户的 Visual Studio 2012 AddIns 文件夹中。
Bash脚本根据文件大小更改 move 文件夹？
我在专有的 linux 发行版中有一些自动下载。他们去临时暂存盘。我想在它们完成后将它们 move 到主 RAID 阵列。我能看到的最好方法是检查磁盘上的文件夹，看看内容是否在最后一分钟发生了变化。
svn - 合并时忽略文件/文件夹
我目前正在使用 SVN 对我的软件项目进行版本控制。在一个正在进行的项目中，我有主干，用于客户的共同功能和规范以及分支，用于客户特定的。有没有办法在每次执行此类操作时标记一些不应合并到分支中的文
shell - 如何排除要删除的文件/文件夹
这个问题在这里已经有了答案: How to exclude a directory in find . command (45 个回答) 8 年前关闭。如何删除文件夹中的所有内容并排除特定文件夹和文
java - 创建文件/文件夹
如何在特定目录中创建具有当前日期和时间的文件夹或文件？ DateTimeFormatter f = DateTimeFormatter.ofPattern("uuuuMMdd HHmmss") ; L
sublimetext3 - 如何在系统文件资源管理器中打开文件/文件夹？
有没有办法在系统文件资源管理器的左侧“文件夹”栏中打开文件或文件夹？如果没有这个，我必须打开文件资源管理器并一直导航到该文件夹所在的位置才能操作文件，这确实很不方便。对于大多数带有这样导航栏的工具
去获取不下载到 SRC 文件夹
预期:我使用 go get 安装包，它在 src 文件夹中创建了所有必要的文件夹，但它们只出现在 pkg/mod 文件夹中，我不能使用它们。现实:它说它正在下载，完成，然后什么都没有。一切都在 W
PowerShell:从压缩文件中提取特定文件/文件夹
说 foo.zip包含: a b c |- c1.exe |- c2.dll |- c3.dll 哪里a, b, c是文件夹。如果我 Expand-Archive .\foo.zip -Destin
magento var 文件夹
不久前我正在删除 var 文件夹中 Magento 的缓存。我可能是错的，但我认为我犯了一个错误，而不是删除 var/cache 中的所有内容，而是意外删除了 var 中的所有内容。 Magento
svn - 通过Tortoise从SVN删除文件/文件夹: how to?
我在 svn 存储库的单独文件夹中有一些代码项目。现在我在删除文件时遇到一些问题:大多数时候一切顺利，但有时当我从磁盘删除文件或文件夹时， checkin 过程会出现各种错误。所以我想知道:在sv
r - 自动删除文件/文件夹
有没有什么方法可以用很少的R命令行自动删除所有文件或文件夹？我知道 unlink() 或 file.remove() 函数，但对于这些函数，您需要定义一个字符向量，其中包含您想要的文件的所有名称删除。
powershell - 获取未在特定日期范围内写入的文件/文件夹
用于在文件夹中查找不符合Get-Childitem的LastWriteTime过滤器日期范围标准的文件的powershell命令是什么？因此，请检查目录中是否包含不包含在01/10/2012(十月1
NSIS 卸载程序不会删除文件/文件夹
我正在为我工作的公司内部使用的应用程序之一编写 NSIS 安装程序，安装过程工作正常，所有 REG 键都已创建，文件夹和服务也没有问题，该应用程序使用。出于某种我无法理解的原因，卸载过程不起作用。
excel - 文件夹.文件的相对路径
我有一个 Excel 文件，并且在同一文件夹中还有一个包含我想要包含的 CSV 文件的文件夹。使用“来自文件夹”查询，第一步将给出以下查询: = Folder.Files("D:\OneDrive\D
docker - 如何创建XFS格式的磁盘/文件夹
我在docker中玩ScyllaDB。为了使ScyllaDB在docker生产设置中最有效地运行，它需要一个XFS格式的磁盘。您知道如何在Linux和MacO中创建XFS容器卷，磁盘文件吗？谢谢
带乘法的 Haskell 文件夹
我应该编写一个函数，其中包含之前每次与该数字相乘的乘积基本上是这样的: > productFromLeftToRight [2,3,4,5] [120,60,20,5] 我应该使用高阶函数，例如折叠

首页

博学

6Ren·AI

商城

python - 如何列出给定 GCS 存储桶中的所有顶级文件夹？