gpt4 book ai didi

hadoop - Hive 命令执行 NOT IN 子句

转载 作者:可可西里 更新时间:2023-11-01 14:15:44 26 4
gpt4 key购买 nike

我有两个表,tab1 和 tab2。

tab1(T1)  tab2(T2)
a1 b1
b1 c1
c1 f1
d1 g1

我正在寻找表 T1 中不存在于 T2 中的值。在这种情况下,输出应该是 a1 d1

我已尝试使用以下查询,但无法获得正确的解决方案。

select distinct tab1.T1 from tab1 left semi join tab2 on (tab1.T1!=tab2.T2);

最佳答案

SELECT t1.str
FROM tab1 t1
LEFT OUTER JOIN tab2 t2 ON t1.str = t2.str
WHERE t2.str IS NULL;

结果:

OK
a1
d1

“Why is the t2.str is null condition there”:左外连接确保第一个表中的所有值都包含在结果中。那么当第二个表中没有值时会发生什么:在这种情况下,第二个表中的所有列都报告为空。

所以在上面的例子中,我们正在精确地搜索第二个表条目丢失的情况——因此我们:

  • 从表二中选择一个永不为空(又名不为空)的列。
  • 那么:number 是一个始终存在的列吗?如果没有,请选择另一个
  • 指定条件“table1-alias”。“table1-never-null-column”= null。这意味着记录实际上不存在于连接条件中 - 因此我们发现记录仅存在于表 1 中。

关于hadoop - Hive 命令执行 NOT IN 子句,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20880124/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com