gpt4 book ai didi

hadoop - 如何计算 Hive 中两个数组的交集和并集?

转载 作者:可可西里 更新时间:2023-11-01 15:02:12 36 4
gpt4 key购买 nike

例如路口

select intersect(array("A","B"), array("B","C"))

应该返回

["B"]

和工会

 select union(array("A","B"), array("B","C"))

应该返回

["A","B","C"]

在 Hive 中实现此功能的最佳方法是什么?我已经检查了配置单元文档,但找不到任何相关信息来执行此操作。

最佳答案

您的问题解决方案就在这里。转到 githubLink ,有很多 udf 是由 klout 创建的。下载、创建 JAR 并将 JAR 添加到配置单元中。示例

 CREATE TEMPORARY FUNCTION combine AS 'brickhouse.udf.collect.CombineUDF';
CREATE TEMPORARY FUNCTION combine_unique AS 'brickhouse.udf.collect.CombineUniqueUDAF';

select combine_unique(combine(array('a','b','c'), array('b','c','d'))) from reqtable;

OK
["d","b","c","a"]

关于hadoop - 如何计算 Hive 中两个数组的交集和并集?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36145842/

36 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com