gpt4 book ai didi

hadoop - Hive 使用收集聚合

转载 作者:可可西里 更新时间:2023-11-01 16:15:37 26 4
gpt4 key购买 nike

我想从配置单元表中删除重复值所以我正在使用这个查询

INSERT INTO TABLE final_table 
select
A,
B,
collect(coalesce(C,0))[0],
collect(coalesce(D,0))[0],
collect(coalesce(E,0))[0],
collect(coalesce(F,0))[0],
collect(coalesce(G,0))[0]
from
temp_table
group by
A,B ;

因为 A,B 是主键。

但结果我仍然得到重复值。查询有问题吗?

最佳答案

尝试使用“collect_set”UDF,或收集到 map 中,然后使用“map_keys”从 map 中获取键。

关于hadoop - Hive 使用收集聚合,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22033247/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com