gpt4 book ai didi

使用 IN 与 NOT IN 时 Postgresql 的巨大性能差异

转载 作者:行者123 更新时间:2023-11-29 11:56:09 25 4
gpt4 key购买 nike

我有 2 个表,“transaksi”和“buku”。 “transaksi”有大约 25 万行,而 buku 有大约 17 万行。两个表都有名为“k999a”的列,并且两个表都没有使用索引。现在我检查这两个语句。

语句 1:

explain select k999a from transaksi where k999a not in (select k999a from buku);

语句 1 输出:

 Seq Scan on transaksi  (cost=0.00..721109017.46 rows=125426 width=9)
Filter: (NOT (SubPlan 1))
SubPlan 1
-> Materialize (cost=0.00..5321.60 rows=171040 width=8)
-> Seq Scan on buku (cost=0.00..3797.40 rows=171040 width=8)

声明 2:

explain select k999a from transaksi where k999a in (select k999a from buku);

语句 2 输出:

Hash Semi Join  (cost=6604.40..22664.82 rows=250853 width=9)
Hash Cond: (transaksi.k999a = buku.k999a)
-> Seq Scan on transaksi (cost=0.00..6356.53 rows=250853 width=9)
-> Hash (cost=3797.40..3797.40 rows=171040 width=8)
-> Seq Scan on buku (cost=0.00..3797.40 rows=171040 width=8)

为什么在NOT IN查询中,postgresql会循环join,导致查询时间过长?

PS: windows 10 上的 postgresql 版本 9.6.1

最佳答案

这是意料之中的。使用 WHERE NOT EXISTS 可能会获得更好的性能:

SELECT k999a
FROM transaksi
WHERE NOT EXISTS (
SELECT 1 FROM buku WHERE buku.k999a = transaksi.k999a LIMIT 1
);

以下是对每种方法的解释:https://explainextended.com/2009/09/16/not-in-vs-not-exists-vs-left-join-is-null-postgresql/

关于使用 IN 与 NOT IN 时 Postgresql 的巨大性能差异,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52638557/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com