- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我有一个关于 SQL Server 索引的问题。我不是 DBA,我想答案对你们这些人来说是很清楚的。我正在使用 SQL Server 2008。
我有一个类似于以下的表格(但有更多的列):
CREATE TABLE [dbo].[Results](
[ResultID] [int] IDENTITY(1,1) NOT NULL,
[TypeID] [int] NOT NULL,
[ItemID] [int] NOT NULL,
[QueryTime] [datetime] NOT NULL,
[ResultTypeID] [int] NOT NULL,
[QueryDay] AS (datepart(day,[querytime])) PERSISTED,
[QueryMonth] AS (datepart(month,[querytime])) PERSISTED,
[QueryYear] AS (datepart(year,[querytime])) PERSISTED,
CONSTRAINT [PK_Results] PRIMARY KEY CLUSTERED
(
[ResultID] ASC
)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON, FILLFACTOR = 90) ON [PRIMARY]
) ON [PRIMARY]
这里要注意的重要字段是 ResultID(主键)和 QueryTime(生成结果的日期时间)。
我还有以下索引(除其他外):
CREATE NONCLUSTERED INDEX [IDX_ResultDate] ON [dbo].[Results]
(
[QueryTime] ASC
)
INCLUDE ( [ResultID],
[ItemID],
[TypeID]) WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, SORT_IN_TEMPDB = OFF, IGNORE_DUP_KEY = OFF, DROP_EXISTING = OFF, ONLINE = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON, FILLFACTOR = 90) ON [PRIMARY]
在我的表中有大约一百万行的数据库中,在执行查询时使用索引,例如:
select top 1 * from results where querytime>'2009-05-01' order by ResultID asc
在同一数据库的另一个实例中,有 5000 万行,SQL Server 决定不使用该索引,因为它会执行聚簇索引扫描,但速度非常慢。 (速度取决于日期)。即使我使用查询提示使其使用 IDX_ResultDate,它仍然有点慢并且它花费 94% 的时间按 ResultID 排序。我认为通过创建一个索引,同时将 ResultID 和 QueryTime 作为索引中的排序列,我可以加快查询速度。
因此我创建了以下内容:
CREATE NONCLUSTERED INDEX [IDX_ResultDate2] ON [dbo].[Results]
(
[QueryTime] ASC,
[ResultID] ASC
)
INCLUDE ( [ItemID],
[TypeID]) WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, SORT_IN_TEMPDB = OFF, IGNORE_DUP_KEY = OFF, DROP_EXISTING = OFF, ONLINE = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON, FILLFACTOR = 90) ON [PRIMARY]
GO
我假设它会首先使用按 QueryTime 排序来查找匹配结果,这些结果已经按 ResultID 排序。然而,情况并非如此,因为该索引对现有索引的性能没有任何改变。
然后我尝试了以下索引:
CREATE NONCLUSTERED INDEX [IDX_ResultDate3] ON [dbo].[Results]
(
[ResultID] ASC,
[QueryTime] ASC
)
INCLUDE ( [ItemID],
[TypeID]) WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, SORT_IN_TEMPDB = OFF, IGNORE_DUP_KEY = OFF, DROP_EXISTING = OFF, ONLINE = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON, FILLFACTOR = 90) ON [PRIMARY]
GO
这会产生预期的结果。它似乎以恒定时间(几分之一秒)返回。
但是,我对为什么 IDX_ResultDate3 运行良好而 IDX_ResultDate2 运行不佳感到困惑。
我假设在排序的 QueryTime 列表中进行二进制搜索,然后查看它的 ResultID 子列表中的第一个结果是获得结果的最快方法。 (因此我的初始排序顺序)。
附带问题:我是否应该创建一个包含 QueryTime 日期部分的持久化列并在其上建立索引(我已经有三个持久化列,如您在上面看到的那样)?
最佳答案
I would assume that a binary search in as sorted list of QueryTime followed by peeking at the first result in it's child list of ResultIDs is the fastest way at getting the result. (Hence my initial sort order).
那确实会很快,但是您的查询表达了不同的请求:您正在请求具有最小 ResultId 的结果来自“2009-05-01”之后发生的所有查询。为了满足它必须在范围的开头('2009-05-01')寻找的请求,从这个位置开始扫描以提取所有ResultId,对它们进行排序然后返回前1(最小ResultId)。您添加的第二个索引 [idx_ResultDate2] 也无济于事。查询必须执行几乎完全相同的搜索和扫描:ResultIds 在结果日期内排序,因此要从之后的所有结果中找出最靠前的 ResultId '2009-05-01' 查询仍然必须扫描索引直到结束。
在您的最后一个索引 [IDX_ResultDate3] 上,查询是作弊的。它的作用是开始对索引进行扫描并查看 QueryTime 值,知道在该索引中扫描第一个 QueryTime 在所需范围内的结果 (> '2009-05-01 ') 就是你想要的(因为 ResultId 保证是 Top 1)。纯属运气,你在“几分之一秒”内得到结果:你在索引的开头有一个匹配的结果。查询可能会扫描整个索引并匹配非常纬度的结果。您可以插入一个带有“2010-01-01”之类的 QueryTime 的新结果,然后寻找它,您会看到性能下降,因为查询必须扫描整个索引直到结束(仍然比表扫描快,因为较窄的索引大小)。
我的问题是:您是否绝对肯定您的查询必须返回 ORDER BY ResultID 中的 TOP 1?或者您只是随意选择订单?如果您可以将 ORDER BY 请求更改为 QueryTime,那么任何索引(更新:最左边的列是 QueryTime)将返回一个简单的 Seek 和 Fetch,没有 scansn 也没有排序。
关于sql-server - SQL Server 索引顺序(日期时间字段),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1105542/
本周我将在 Windows Server 2008 上设置一个专用的 SQL Server 2005 机器,并希望将其精简为尽可能简单,同时仍能发挥全部功能。 为此,“服务器核心”选项听起来很有吸引力
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 这个问题似乎与 help center 中定义的范围内的编程无关。 . 已关闭 8 年前。 Improve
我获取了 2014 版本数据库的备份,并尝试在另一台服务器中将其恢复到具有相同名称和登录名的数据库中。此 SQL Server 版本是 2016。 恢复备份文件时,出现此错误: TITLE: Micr
我获取了 2014 版本数据库的备份,并尝试在另一台服务器中将其恢复到具有相同名称和登录名的数据库中。此 SQL Server 版本是 2016。 恢复备份文件时,出现此错误: TITLE: Micr
TFS 是否提供任何增强的方法来存储对 sql server 数据库所做的更改,而不是使用它来对在数据库上执行的 sql 语句的文本文件进行版本控制? 或者我正在寻找的功能是否仅在第 3 方工具(如
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 9 年前。 Improve this ques
我即将将我的 SQL Server 2012 实例升级到 SQL Server 2014。 我已经克隆了主机 Windows VM 并将其重命名为 foo-2012至 foo-2014 . 重新启动时
我想为 SQL Server 登录授予对数据库的访问权限。我知道 sp_grantdbaccess,但它已被弃用。我可以改用什么以及如何检查登录名是否还没有访问数据库的权限? 场景:UserA 创建数
客户别无选择,只能在接下来的几天内从 sql server 2000 迁移到 2008。测试显示 2005 年的重要功能出现了 Not Acceptable 性能下降,但 2008 年却没有。好消息是
我有一个测试数据库,我需要将其导出到我们客户的测试环境中。 这将是一次性的工作。 我正在使用 SQL Server 2005(我的测试数据库是 SQL Server 2005 Express) 执行此
我需要将一个 CSV 文件导入到 mongoDB 不幸的是我遇到了以下错误: error connecting to host: could not connect to server: se
我以为 R2 是一个补丁/服务包。我一直在寻找下载,但没有看到。因此,我假设 R2 是一个新版本,并且我需要 sqlserver 2008 r2 的安装介质来进行升级? 另外,我需要为新许可证付费吗?
我无法使用 SQL Server Management Studio 连接到 SQL Server。 我有一个连接字符串: 我尝试通过在服务器名中输入 myIP、在登录名中输入 MyID、在密码中
我们希望使用 SQL Server 加密来加密数据库中的几个列。我们还需要在生产和测试环境之间传输数据。看来最好的解决方案是在生产和测试服务器上使用相同的主 key 、证书和对称 key ,以便我可以
有没有可以分析 SQL Server 数据库潜在问题的工具? 例如: a foreign key column that is not indexed 没有 FILL FACTOR 的 uniquei
我正在尝试从我的 SQL 2012 BI 版本建立复制,但我收到一条奇怪的错误消息! "You cannot create a publication from server 'X' because
如果您使用 SQL Server 身份验证 (2005),登录详细信息是否以明文形式通过网络发送? 最佳答案 如您所愿,安全无忧... 您可以相当轻松地配置 SSL,如果您没有受信任的证书,如果您强制
我想将数据从一个表复制到不同服务器之间的另一个表。 如果是在同一服务器和不同的数据库中,我使用了以下 SELECT * INTO DB1..TBL1 FROM DB2..TBL1 (to copy w
我希望得到一些帮助,因为我在这个问题上已经被困了 2 天了! 场景:我可以从我的开发计算机(和其他同事)连接到 SERVER\INSTANCE,但无法从另一个 SQL Server 连接。我得到的错误
我正在尝试从我的 SQL 2012 BI 版本建立复制,但我收到一条奇怪的错误消息! "You cannot create a publication from server 'X' because
我是一名优秀的程序员,十分优秀!