gpt4 book ai didi

python - 在 Python 中读取位于 S3 子文件夹下的文件的内容

转载 作者:行者123 更新时间:2023-12-05 01:06:03 24 4
gpt4 key购买 nike

我正在尝试从 S3 存储桶读取文件内容(而不是下载)。问题是该文件位于多级文件夹下。例如,完整路径可以是 s3://s3-bucket/folder-1/folder-2/my_file.json。如何获取该特定文件,而不是使用列出所有对象的迭代方法?

这是我要更改的代码:

import boto3

s3 = boto3.resource('s3')
bucket = s3.Bucket('s3-bucket')
for obj in my_bucket.objects.all():
key = obj.key
if key == 'folder-1/folder-2/my_file.json':
return obj.get()['Body'].read()

能否以更简单、更直接的方式完成?

最佳答案

是的 - 无需枚举存储桶。

使用 s3.Object 直接读取文件,提供存储桶名称作为第一个参数,对象键作为第二个参数。

“文件夹”在 S3 中并不存在 - Amazon S3 不使用层次结构来组织其对象和文件。为了组织简单起见,Amazon S3 控制台将“文件夹”显示为对对象进行分组的一种方式,但它们最终会融入您的对象键中。

这应该可行:

import boto3
s3 = boto3.resource('s3')
obj = s3.Object("s3-bucket", "folder-1/folder-2/my_file.json")
body = obj.get()['Body'].read()

关于python - 在 Python 中读取位于 S3 子文件夹下的文件的内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/69882380/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com