- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我的两个问题是:
详细来说,我有一个数据库,其中包含几个包含公司数据的非常大(100 到 10 亿行之间)的表。通常在这样的表中有大约 20-40 家公司的数据,每家公司都是自己的“ block ”,由“CompanyIdentifier”(INT) 标记。此外,每家公司都有大约 20 个部门,每个部门都有自己的“子 block ”,由“部门标识符”(INT) 标记。
经常会在表中添加或删除整个“ block ”或“子 block ”。我的第一个想法是在这些 block 上使用表分区,但由于我使用的是 SQL Server 2008 标准版,所以我无权使用它。不过,我的大多数查询都是在“ block ”或“子 block ”上执行的,而不是在整个表上执行的。
我一直致力于为以下功能优化这些表:
对于 1) 和 2) 我没有遇到太多问题。我在关键字段上创建了几个索引(在有用的地方还包含 CompanyIdentifier 和 DepartmentIdentifier)并且查询运行良好。
但是对于 3) 我一直在努力寻找一个好的解决方案。我的第一个策略是始终禁用索引,批量插入一个大块并重建索引。刚开始是很快的,但是现在数据库里的公司很多,每次重建索引都需要很长时间。
目前我的策略已更改为在插入时只保留索引,因为现在这似乎更快。但我想进一步优化插入速度。
我似乎已经注意到,通过添加在 CompanyIdentifier + DepartmentIdentifier 上定义的聚集索引,可以更快地将新“ block ”加载到表中。在我放弃这种策略以支持在 IDENTITY 列上添加聚簇索引之前,正如几篇文章向我指出的那样,聚簇索引包含在所有其他索引中,因此聚簇索引应尽可能小。但现在我正在考虑恢复这个旧策略来加速插入。我的问题是,这是明智的,还是我会在其他方面遭受性能损失?这真的会加快我的插入速度还是只是我的想象?
我也不确定在我的情况下是否真的需要 IDENTITY 列。我希望能够与其他表建立外键关系,但我是否也可以为此使用 CompanyIdentifier+DepartmentIdentifier+[uniquifier] 方案?或者它是否必须是全表的、碎片化的 IDENTITY 编号?
非常感谢任何建议或解释。
最佳答案
好吧,我已经对其进行了测试,在两个“ block 定义”列上放置聚集索引提高了我的表的性能。
与我有聚簇 IDENTITY 键的情况相比,现在插入 block 的速度相对较快,而且与没有任何聚簇索引时的速度差不多。删除 block 比使用或不使用聚簇索引更快。
我认为我想删除或插入的所有记录都保证都在硬盘的某个部分上,这使得表速度更快 - 这对我来说似乎是合乎逻辑的。
更新:经过一年的这种设计经验,我可以说要使这种方法起作用,有必要安排定期重建所有索引(我们每周进行一次)。否则,索引很快就会碎片化,性能会下降。尽管如此,我们正在迁移到具有分区表的新数据库设计,这基本上在各个方面都更好——除了企业服务器许可成本,但我们现在已经忘记了它。至少我有。
关于sql-server - 非标识列上的聚簇索引可加速批量插入?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3733735/
本周我将在 Windows Server 2008 上设置一个专用的 SQL Server 2005 机器,并希望将其精简为尽可能简单,同时仍能发挥全部功能。 为此,“服务器核心”选项听起来很有吸引力
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 这个问题似乎与 help center 中定义的范围内的编程无关。 . 已关闭 8 年前。 Improve
我获取了 2014 版本数据库的备份,并尝试在另一台服务器中将其恢复到具有相同名称和登录名的数据库中。此 SQL Server 版本是 2016。 恢复备份文件时,出现此错误: TITLE: Micr
我获取了 2014 版本数据库的备份,并尝试在另一台服务器中将其恢复到具有相同名称和登录名的数据库中。此 SQL Server 版本是 2016。 恢复备份文件时,出现此错误: TITLE: Micr
TFS 是否提供任何增强的方法来存储对 sql server 数据库所做的更改,而不是使用它来对在数据库上执行的 sql 语句的文本文件进行版本控制? 或者我正在寻找的功能是否仅在第 3 方工具(如
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 9 年前。 Improve this ques
我即将将我的 SQL Server 2012 实例升级到 SQL Server 2014。 我已经克隆了主机 Windows VM 并将其重命名为 foo-2012至 foo-2014 . 重新启动时
我想为 SQL Server 登录授予对数据库的访问权限。我知道 sp_grantdbaccess,但它已被弃用。我可以改用什么以及如何检查登录名是否还没有访问数据库的权限? 场景:UserA 创建数
客户别无选择,只能在接下来的几天内从 sql server 2000 迁移到 2008。测试显示 2005 年的重要功能出现了 Not Acceptable 性能下降,但 2008 年却没有。好消息是
我有一个测试数据库,我需要将其导出到我们客户的测试环境中。 这将是一次性的工作。 我正在使用 SQL Server 2005(我的测试数据库是 SQL Server 2005 Express) 执行此
我需要将一个 CSV 文件导入到 mongoDB 不幸的是我遇到了以下错误: error connecting to host: could not connect to server: se
我以为 R2 是一个补丁/服务包。我一直在寻找下载,但没有看到。因此,我假设 R2 是一个新版本,并且我需要 sqlserver 2008 r2 的安装介质来进行升级? 另外,我需要为新许可证付费吗?
我无法使用 SQL Server Management Studio 连接到 SQL Server。 我有一个连接字符串: 我尝试通过在服务器名中输入 myIP、在登录名中输入 MyID、在密码中
我们希望使用 SQL Server 加密来加密数据库中的几个列。我们还需要在生产和测试环境之间传输数据。看来最好的解决方案是在生产和测试服务器上使用相同的主 key 、证书和对称 key ,以便我可以
有没有可以分析 SQL Server 数据库潜在问题的工具? 例如: a foreign key column that is not indexed 没有 FILL FACTOR 的 uniquei
我正在尝试从我的 SQL 2012 BI 版本建立复制,但我收到一条奇怪的错误消息! "You cannot create a publication from server 'X' because
如果您使用 SQL Server 身份验证 (2005),登录详细信息是否以明文形式通过网络发送? 最佳答案 如您所愿,安全无忧... 您可以相当轻松地配置 SSL,如果您没有受信任的证书,如果您强制
我想将数据从一个表复制到不同服务器之间的另一个表。 如果是在同一服务器和不同的数据库中,我使用了以下 SELECT * INTO DB1..TBL1 FROM DB2..TBL1 (to copy w
我希望得到一些帮助,因为我在这个问题上已经被困了 2 天了! 场景:我可以从我的开发计算机(和其他同事)连接到 SERVER\INSTANCE,但无法从另一个 SQL Server 连接。我得到的错误
我正在尝试从我的 SQL 2012 BI 版本建立复制,但我收到一条奇怪的错误消息! "You cannot create a publication from server 'X' because
我是一名优秀的程序员,十分优秀!