gpt4 book ai didi

hadoop - hive 搜索 2 列存在于第二个表的单个列中

转载 作者:行者123 更新时间:2023-12-02 21:10:14 25 4
gpt4 key购买 nike

在 hive 中有 2 张 table 。表 2 是一个拥有数十亿条记录的主表。

表格1

name| id1 | id2
jac | 1 | 2
rac | 3 | 1

表 2
class | id
first | 1
second| 3

如何在 hive 中编写有效的查询来搜索表 1 中的 id1 和 id2 都存在于表 2 中并隔离这些记录?

谢谢
小姐

最佳答案

大概JOIN是最好的方法:

select t1.*
from table1 t1 join
table2 t2a
on t1.id1 = t2a.id join
table2 t2b
on t1.id2 = t2b.id;

在其他数据库中, EXISTSIN可能会更好,尤其是索引。我的猜测是一个简单的 JOIN在 Hive 中效果最好。

关于hadoop - hive 搜索 2 列存在于第二个表的单个列中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40493545/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com