gpt4 book ai didi

json - 删除/映射 Hive 表上的重复键?

转载 作者:可可西里 更新时间:2023-11-01 15:55:55 26 4
gpt4 key购买 nike

我有 JSON 文件要加载到 Hive 表,但它包含使所有数据为空或无法在 Hive 上选择查询的重复键。

那些 JSON 文件有这样的东西:

{"timeSeries":"17051233123","id":"123","timeseries":"17051233123","name":"sample"}

我尝试创建配置单元表

CREATE EXTERNAL TABLE table_hive (`id` 
STRING, `name` STRING, `timeseries` STRING,`timeseries2` STRING)
ROW FORMAT SERDE 'org.openx.data.jsonserde.JsonSerDe'
WITH SERDEPROPERTIES ( "mapping.timeseries2" = "timeSeries")
LOCATION 'app/jsonfile.json';

如何让它变成可查询的hive表?

最佳答案

与 Hive 发行版附带的 JSON SerDe 配合良好

create external table table_hive 
(
id string
,name string
,timeseries string
)
row format serde 'org.apache.hive.hcatalog.data.JsonSerDe'
stored as textfile
;

select * from table_hive
;

+-----+--------+-------------+
| id | name | timeseries |
+-----+--------+-------------+
| 123 | sample | 17051233123 |
+-----+--------+-------------+

关于json - 删除/映射 Hive 表上的重复键?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44197477/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com