sql - 我可以使用索引优化包含 WHERE Value <> 2 的请求吗-6ren

sql - 我可以使用索引优化包含 WHERE Value <> 2 的请求吗

转载作者：行者123 更新时间：2023-12-04 22:23:36

25

4

这是我的要求:
SELECT TOP 10 * FROM BigTable WHERE Value <> 2;
BigTable 有点特殊，如 Value列的每一行都包含相同的值:2 .在实际情况下，可能有几行具有不同的值，但不会很多。我正是需要找到这些流氓行。但是，我在设计时不知道哪个值(2 只是一个例子)(但我在查询时知道)。

请求很慢(大约 5 分钟)； BigTable 包含 1000 万行。

所以我在Value上加了一个索引列，类型为 smallint。 10 分钟后，索引建立，我再次运行请求。它仍然很慢。

该问题可以在这里重现:http://sqlfiddle.com/#!6/6ce0f/1

在这一点上，我的猜测是 SQL Server 不能对带有 <> 的查询使用索引。运营商，但我不知道为什么？例如，这个其他查询只需要 2 秒:SELECT TOP 10 Value FROM BigTable GROUP BY Value (并且它返回单行，如预期的那样具有值 2)。

我正在考虑拆分为多个查询:一个获取不同值的列表，另一个获取所有恶意行，例如 SELECT TOP 10 * FROM BigTable WHERE Value = x等(所有不是 2 的值)，但是有更好的解决方案吗？

编辑:

此查询的想法是在更新大多数行的过程之后查找尚未更新的行。基本上，我正在与另一个数据源同步。每次我运行这个过程时，我都会增加这个值，它会用新值(以及更新的数据)更新每一行。在该过程结束时，我可以检查哪些行具有旧值，然后将其删除。这个过程有点长，这就是为什么我不想先截断表然后插入，因为我需要在这个过程执行期间保持以前的数据可用。

索引是使用此请求创建的(由 Entity Framework Core 生成，但我手动进行查询测试):

CREATE NONCLUSTERED INDEX [IX_Value] ON [dbo].[BigTable]
(
    [Value] ASC
)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, SORT_IN_TEMPDB = OFF, DROP_EXISTING = OFF, ONLINE = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON)

编辑2:

这是来自 SSMS 的估计查询计划(不是绝密，但由于我没有问我是否可以透露该项目是关于什么的，我已经模糊了数据库名称；在这些屏幕截图中，表和列名称也是真实的那些)
Value <> 2 的查询计划

你可以看到它没有使用 IX_Establishments_UpdateTag根本(索引扫描在主键上)。执行时间:5min 18s(在这次运行中，我有一行 Value/UpdateTag 不是 2)
Value < 2 的查询计划

这里 IX_Establishments_UpdateTag索引被使用。执行时间小于 1 秒(SSMS 报告 0s)。

最佳答案

SQL 可以为 <> 使用索引查询。 “可以”不代表会，只代表优化器会考虑。

SQL一般在使用时有问题OR存在——这些通常(也许总是？)导致全表扫描。 Value IN (1,2,3)必须“转换”为“Value = 1 OR Value = 2 OR Value = 3`。
Value < 2 OR Value > 2看起来很明显，但优化器可能不够聪明，无法意识到这相当于 Value <> 2 ... 所以它留下了 OR , 并伴随着表扫描。

至于为什么Value <> 2运行速度不快，这取决于您的数据。在这里做一些猜测，但没有深入必要的细节:

您有大量数据(1000 万行，好吧，但每行有多少字节？...引发了对页面和范围的讨论。)

您说很少是 <> 2(或任何您的目标值)

查询优化器使用索引统计信息来决定是否使用给定的索引

统计数据是通过对数据进行采样来构建的。如果数据如此稀少，则可能是在构建统计信息时没有采样非 2 值，因此优化器认为所有值都是 2，并将索引标记为基本无用。

(可以通过运行查看统计信息

dbcc show_statistics (<TableName>, <IndexName>)

然而，理解统计数据完全是另一回事。如果您想深入了解，请查看网络上的相关文章和讨论。)

上面有很多“为什么”。如果没有深入研究数据，分析统计数据，以及诸如此类的胡言乱语，我还没有现成的解决办法。作为一个实验，如果我们把你的 < OR >查询和 AND询问？尝试

where not (Value >= 2 and Value <= 2)

看起来很傻，可能不起作用，但值得一试，看看会发生什么。

关于sql - 我可以使用索引优化包含 WHERE Value <> 2 的请求吗，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46057542/

25

4

0

文章推荐： gwt - 历史管理(刷新按钮)

文章推荐： tsql - 如何在 SQL Server 中将 DateTime 字符串转换为 DateTime

文章推荐： clojure - 使用 Clojure 的初创公司

javascript - 将 json 编码的字符串转换为 [value, value],[value, value]
我正在尝试使用 flot 绘制 SQL 数据库中的数据图表，这是使用 php 收集的，然后使用 json 编码的。目前看起来像: [{"month":"February","data":482},
php - php数组的结果是[value][value]，我怎样才能得到像[value,value]这样的结果
我有一个来自 php 行的 json 结果，类似于 ["value"]["value"] 我尝试使用内爆函数，但得到的结果是“value”“value” |id_kategori|created_at
javascript - 为什么 select.setAttribute ('value' ,value) 产生与 select.value=value 不同的结果？
脚本 1 将记录 two 但浏览器仍会将 select 元素呈现为 One。该表单还将提交值 one。脚本 2 将记录、呈现和提交两个。我希望它们是同义词并做同样的事情。请解释它们为何不同，以及我
Python如何做列表字典的字典的.values().values()
我的python字典结构是这样的: ips[host][ip] 每行 ips[host][ip] 看起来像这样: [host, ip, network, mask, broadcast, mac, g
c# - 这是什么意思/做什么？ "value < 0 ? -value : value;"
在 C# 中我正在关注的一本书对设置和获取属性提出了这样的建议: double pri_test; public double Test { get { return pri_test; }
c++ - if (mask & VALUE) 还是 if ((mask & VALUE) == VALUE)？
您可能熟悉 enum 位掩码方案，例如: enum Flags { FLAG1 = 0x1, FLAG2 = 0x2, FLAG3 = 0x4, FLAG4 = 0x8
java - (String)value 和 value.toString() ， new Long(value) 和 (Long)value 之间的区别
在一些地方我看到了(String)value。在一些地方value.toString() 这两者有什么区别，在什么情况下我需要使用哪一个。 new Long(value) 和 (Long)value
javascript - 当 "!value ? null : value[0]"不等同于 "value ? value[0] : null"时，Javascript 中是否存在任何时间？
有没有什么时候 var result = !value ? null : value[0]; 不会等同于 var result = value ? value[0] : null; 最佳答案在此处将
javascript - 如何修复 "My first scan value is not same as my second scan value and the value scan in HTML is not same as value scan in notepad?"
我正在使用扫描仪检测设备。目前，我的条形码的值为 2345345 A1。因此，当我扫描到记事本或文本编辑器时，输出将类似于 2345345 A1，这是正确的条形码值。问题是: 当我第一次将条形码扫描
c# - 如何转换 Json key :value into value:value in C#?
我正在读取 C# 中的资源文件并将其转换为 JSON 字符串格式。现在我想将该 JSON 字符串的值转换为键。例子， [ { "key": "CreateAccount", "text":
Python( Pandas ): replace value if previous value is same as next value
我有以下问题: 我有一个数据框，最多可能有 600 万行左右。此数据框中的一列包含某些 ID。 ID NaN NaN D1 D1 D1 NaN D1 D1 NaN NaN NaN NaN D2 NaN
java - (Float value + Integer value + long value) 如何给出意想不到的结果？
import java.util.*; import java.lang.*; class Main { public static void main (String[] args) thr
android - values、values-v11 和 values-v14 文件夹的样式和主题
我目前正在开发我的应用程序，使其设计基于 Holo 主题。在全局范围内我想做的是工作，但我对文件夹 values、values-v11 和 values-v14. 所以我知道: values 的目标是
java ； HttpURL连接；查询项重复为 `paramName=value, value` 。预计为 `paramName=value`
我遇到了一个非常奇怪的问题。我的公司为我们的各种 Assets 使用集中式用户注册网络服务。我们一般通过HttpURLConnection使用请求方法GET向Web服务发送请求，通过qs设置参数。这
mySQL UPDATE value based on SELECT value of value +1 递增列值
查询: UPDATE nominees SET votes = ( SELECT votes FROM nominees WHERE ID =1 ) +1 错误: You can't specify
javascript - mathjs 评估错误 : (intermediate value)(intermediate value)(intermediate value) is not a function
如果我运行一段代码: obj = {}; obj['number'] = 1; obj['expressionS'] = 'Sin(0.5 * c1)'; obj['c
android - 错误 : String types not allowed (at 'fail' with value) @values/values. xml
我正在为我的应用创建一个带有 Twitter 帐户的登录页面。当我构建我的项目时会发生上述错误。 values/strings.xml @dimen/abc_text_size_medium
mysql - View 中的 SUM(table2.value * table2.value) (+ table1.value)
我在搜索引擎中使用以下 View : CREATE VIEW msr_joined_view AS SELECT table1.id AS msr_id, table1.msr_number, tab
xhtml - 验证错误 "Value Error : background-position Too many values or values are not"如何解决？
为什么验证会返回此错误。如何解决？ ul#navigation li#navigation-3 a.current Value Error : background-position Too
Python 数据帧 : find previous row's value before a specific value with same value in other columns
我有一个数据名如下 import pandas as pd d = { 'Name' : ['James', 'John', 'Peter', 'Thomas', 'Jacob', 'Andr

首页

博学

6Ren·AI

商城

sql - 我可以使用索引优化包含 WHERE Value <> 2 的请求吗