gpt4 book ai didi

java - 使用 Amazon Athena 从 S3 读取多个 json 文件

转载 作者:行者123 更新时间:2023-12-01 16:54:27 25 4
gpt4 key购买 nike

我将员工的日常 Activity 存储在一个文件夹中,名为employee.json,这是我存储在S3中的数据结构。现在我想读取某个日期范围内所有员工的 Activity 。如何使用 Amazon Athena 服务来做到这一点?或者我应该编写一个客户代码来做到这一点。

empId1-->2020-03-01-->employee.json
2020-03-02-->employee.json
2020-03-03-->employee.json
2020-03-04-->employee.json
2020-03-05-->employee.json

empId2-->2020-03-01-->employee.json
2020-03-02-->employee.json
2020-03-03-->employee.json
2020-03-04-->employee.json
2020-03-05-->employee.json

empId3-->2020-03-01-->employee.json
2020-03-02-->employee.json
2020-03-03-->employee.json
2020-03-04-->employee.json
2020-03-05-->employee.json

empId4-->2020-03-01-->employee.json
2020-03-02-->employee.json
2020-03-03-->employee.json
2020-03-04-->employee.json
2020-03-05-->employee.json

最佳答案

尝试查看 Athena 中的分区:https://docs.aws.amazon.com/athena/latest/ug/partitions.html .

这将允许您对基于前缀的 S3 文件的子集运行查询。

关于java - 使用 Amazon Athena 从 S3 读取多个 json 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61617595/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com