gpt4 book ai didi

在配置单元的 udf 上连接两个表

转载 作者:行者123 更新时间:2023-12-02 00:06:39 25 4
gpt4 key购买 nike

在我编写要在配置单元中使用的 udf 之前的一个基本问题。我想连接两个基于自定义 UDF 的表,它从表 a 中获取一个参数,另一个从表 b 中获取。我见过 UDF 的示例,这些示例从要连接的表之一获取参数。从两个表中获取参数是否同样有效?

最佳答案

听起来你想要一个函数

function my_udf(val_A, val_B):
trans_A = <do something to val_A>
trans_B = <do something to val_B>
return trans_A cmp trans_B

UDF 将返回一个 bool 值,您可以在 ON 子句中使用它。

我不确定您是否可以直接在 Hive 中执行此操作,但您始终可以使用两个 UDF 将 val_A 转换为 trans_A 并将 val_B 转换为 trans_B,然后使用正常的 ON:

select *
from
(select *, udf_A(some_column) as trans_A from A) as AA
JOIN
(select *, udf_B(some_column) as trans_B from B) as BB on AA.trans_A = BB.trans_B

关于在配置单元的 udf 上连接两个表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18039235/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com