gpt4 book ai didi

python - Aws Glue - S3 - native Python

转载 作者:太空宇宙 更新时间:2023-11-03 14:13:19 24 4
gpt4 key购买 nike

在 AWS Glue 中,如何处理来自 S3 且每周都会更改的文件。

示例:第一周:“filename01072018.csv”第 2 周:“filename01142018.csv”

这些文件以相同的格式设置,但我需要 Glue 能够每周更改一次,以便将此数据从 S3 加载到 Redshift 中。 Glue 的代码使用原生 Python 作为后端。

最佳答案

AWS Glue 爬网程序应该能够按照命名方式找到您的 CSV 文件,而无需您进行任何配置。

例如,我的 Kinesis 流生成的文件的路径和名称如下所示:

my_events_folder/2018/02/13/20/my-prefix-3-2018-02-13-20-18-28-112ab3f0-5794-4f77-9a84-83efafeecabc
my_events_folder/2018/02/13/20/my-prefix-2-2018-02-13-20-12-00-7f2efb62-827b-46a6-83c4-b4c52dd87d60
...

AWS Glue 只是查找这些文件并自动对它们进行分类。希望这会有所帮助。

关于python - Aws Glue - S3 - native Python,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48353544/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com