gpt4 book ai didi

arrays - 将数据加载到 Hive 数组列

转载 作者:可可西里 更新时间:2023-11-01 15:05:40 25 4
gpt4 key购买 nike

我有两个 Hive 表及其列,如下所示

Tbl_Customer
Id
Name

Tbl_Cntct
Id
Phone

一个Id可以有多个电话号码所以我有一张表

Tbl_All
Id
Name
Phn_List ARRAY

我的问题是如何将数据从 Tbl_Custome 和 Tbl_Cntct 加载到 Tbl_All。我可以在 PIG 中执行此操作,但想在 Hive 中执行同样的操作。

谢谢

最佳答案

Insert overwrite table Tbl_All
select cus.id,cus.name,collect_set(ctc.phone)
from Tbl_Customer cus join Tbl_Cntct ctc on cus.id = ctc.id
group by cus.id,cus.name

collect_set UDAF 是一个函数,将列收集到一个没有重复的数组中。如果你想保留所有值,包括重复的值,请使用 collect_list 函数

关于arrays - 将数据加载到 Hive 数组列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29245956/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com