gpt4 book ai didi

python - Google Cloud Storage 列出具有特定文件名的 Blob 对象

转载 作者:行者123 更新时间:2023-12-05 01:11:40 25 4
gpt4 key购买 nike

在 google.cloud.storage 和 list_blobs 的帮助下,我可以从特定存储桶中获取文件列表。但我想过滤(名称* .ext)存储桶中的确切文件。我无法找到确切的解决方案。

例如:buket=data,prefix_folder_name=sales,在前缀文件夹中我有带有元数据的发票列表。我想获取具体的发票及其元数据(名称*.csv 和名称。*.meta)。此外,如果我循环特定文件夹的整个 all_blob 以获取所选文件,那么这将是大量数据并且可能会影响性能。

如果有人能帮我解决这个问题,那就太好了。

bucket = gcs_client.get_bucket(buket)
all_blobs = bucket.list_blobs(prefix=prefix_folder_name)
for blob in all_blobs:
print(blob.name)

最佳答案

根据google-cloud-storage documentation Blob 是具有 name 属性的对象,因此您可以通过此属性过滤它们。

from google.cloud import storage

# storage_client = gcs client
storage_client = storage.Client()

# bucket_name = "your-bucket-name"
# Note: Client.list_blobs requires at least package version 1.17.0.
blobs = storage_client.list_blobs(bucket_name)

# filter_dir = "filter-string"
[blob.name for blob in blobs if filter_dir in blob.name ]

关于python - Google Cloud Storage 列出具有特定文件名的 Blob 对象,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62800231/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com