gpt4 book ai didi

python - 为什么在列出 S3 文件夹中的文件时我有一个额外的文件

转载 作者:太空宇宙 更新时间:2023-11-03 14:22:18 26 4
gpt4 key购买 nike

我正在尝试列出 S3 存储桶“card-prtnr-npi”中的文件。我想要读取的文件位于 S3“card-prtnr-npi”存储桶中的“ambs_ambivolatile”文件夹中。这是实际路径“card-prtnr-npi/users/rtltest/ambs_ambivolatile”。 “ambs_ambivolatile”文件夹中只有一个文件,但 Boto 3 正在读取一个不存在的附加文件。

文件夹中不存在“users/rtltest/ambs_ambivolatile/”,仅存在“part-m-00026.bz2”。请参阅下面的代码。

['users/rtltest/ambs_ambivolatile/', 'users/rtltest/ambs_ambivolatile/part-m-00026.bz2']

    s3_src_bucket = 'card-prtnr-npi'
s3_src_prefix = 'users/rtltest/ambs_ambivolatile/'
print("getting response from source")
source_bucket = src_session.resource('s3').Bucket(s3_src_bucket)
files = source_bucket.objects.filter(Prefix=s3_src_prefix)
source_keys = []
for file in files:
source_keys.append(file.key)

print(source_keys)

上面的打印语句打印以下列表['用户/rtltest/ambs_ambivolatile/', '用户/rtltest/ambs_ambivolatile/part-m-00026.bz2']

如何停止读取这个额外文件“users/rtltest/ambs_ambivolatile/”。

最佳答案

这不是一个文件,而是您设置的前缀。 S3 没有文件夹的概念。每个文件路径都是一个字符串,并且您过滤了它的开头

尝试排除前缀

source_keys = [file.key for file in files if file.key!=s3_src_prefix] 

关于python - 为什么在列出 S3 文件夹中的文件时我有一个额外的文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47858541/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com