gpt4 book ai didi

amazon-web-services - AWS Athena 扁平化嵌套 JSON 源中的数据

转载 作者:行者123 更新时间:2023-12-04 14:23:49 24 4
gpt4 key购买 nike

我想从 Athena 中的嵌套 JSON 创建一个表。描述的解决方案 here使用 hive Openx-JsonSerDe 等工具尝试在 SQL 语句中镜像 JSON 数据。我只想从 JSON 文件中获取一些字段并创建表。我似乎找不到任何关于如何做到这一点的资源。

例如。
JSON 文件 {"records": [{"a": "data1", "b": "data2", "c": "data3"}]}我想创建的表只有列 ab

最佳答案

我认为您想要实现的是取消嵌套数组以将一个数组条目转换为一行。

这可以通过正确查询数据结构来实现。

表定义:

CREATE external TABLE complex (
records array<struct<a:string,b:string>>
)
ROW FORMAT SERDE 'org.openx.data.jsonserde.JsonSerDe'
LOCATION 's3://bucket/test1/';

询问:
select record.a,record.b from complex 
cross join UNNEST(complex.records) as t1(record);

关于amazon-web-services - AWS Athena 扁平化嵌套 JSON 源中的数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43596006/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com