作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我对 SQL 查询分析还很陌生。最近,我偶然发现其中一个查询存在性能问题,我想知道我的思维过程是否正确,以及为什么查询优化器在这种情况下会以这种方式工作。我是 SQL Server 2012。我有一个看起来像这样的 SQL 查询
SELECT * FROM T1
WHERE Id NOT IN
(SELECT DISTINCT T1_Id from T2);
在我的测试服务器上运行大约需要 30 秒。在试图理解什么花了这么长时间的同时,我使用临时表重写了它,如下所示:
SELECT DISTINCT T1_Id
INTO #temp from T2;
SELECT * FROM T1
WHERE Id NOT IN
(SELECT T1_Id from #temp);
它的运行速度比第一个快一百倍。
有关表格的一些信息:T2 有大约 100 万行,其中大约有 1000 个不同的 T1_id 值。 T1 有大约 1000 多行。最初,我只在 T2 上除 T1_Id 以外的列上有聚集索引,因此根本没有对 T1_id 建立索引。
查看执行计划,我发现对于第一个查询,索引扫描的数量与不同的 T1_id 值的数量一样多,因此在这种情况下,SQL Server 基本上执行大约 1000 次索引扫描。这让我意识到,在 T1_id 上添加非聚集索引可能是一个好主意(不可否认,该索引从一开始就应该存在),并且添加索引确实使原始查询运行得更快,因为现在它确实是非聚集的索引查找。
我正在寻找的是了解原始查询的查询优化器行为 - 它看起来合理吗?有没有什么方法可以让它以类似于我在此处发布的临时表变体的方式工作,而不是进行多次扫描?我只是误会了什么吗?预先感谢您提供类似讨论的任何链接,因为我还没有真正找到任何有用的东西。
最佳答案
Not in 很直观,但速度很慢。这种构造通常会运行得更快。
where id in
(select id from t1
except select t1_id from t2)
关于sql - "NOT IN"在SQL查询中的性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21652715/
我是一名优秀的程序员,十分优秀!