gpt4 book ai didi

amazon-web-services - AWS Athena : use "folder" name as partition

转载 作者:行者123 更新时间:2023-12-04 00:14:37 31 4
gpt4 key购买 nike

我在s3中存储了成千上万个单独的json文件(对应于一个Table行),其路径如下:s3://my-bucket/<date>/dataXX.json
当我在DDL中创建表时,是否可以按S3路径中的当前分区对数据进行分区? (或至少将值添加到新列中)

谢谢

最佳答案

遗憾的是,雅典娜不支持此功能。要使用文件夹进行分区,必须对文件夹的命名方式提出要求。

例如
s3://my-bucket/{columnname} = {columnvalue}/data.json

在您的情况下,如果您将那些分区手动添加到表中,则仍可以使用分区。

例如
ALTER TABLE表名ADD PARTITION(datecolumn ='2017-01-01')位置's3://my-bucket/2017-01-01/

AWS文档针对该主题提供了一些很好的示例。

AWS Athena Partitioning

关于amazon-web-services - AWS Athena : use "folder" name as partition,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42527438/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com