- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
我们团队面临一个查询大量数据的问题,sql server blocks inserting into table。
我们正在处理一个涉及保存和查询大量数据的 .NET 项目。该项目包含两个数据库,一个是实时数据库,另一个是历史数据库,都是 SQL Server 数据库,它们位于不同的机器上。两个数据库的表结构完全一样,只有四张表。
Realtime DB包含少量的实时数据,里面的数据是不断更新的。历史数据库包含所有更新历史。当项目运行时,它会将更新查询发送到实时数据库,并将查询插入历史数据库。每天将在历史数据库上执行大约 200 万次插入。查询是异步执行的。
历史数据库还将用于数据检索和报告目的。人们将在服务器上运行查询,他们将运行什么查询是我们无法控制的。我们现在面临的问题是,当一个返回很多行的查询运行时,连接池会在短时间内被占满,导致连接超时,导致数据丢失。
我们试过调整表的索引,增加连接池的最大大小和增加超时时间,但都不能从根本上解决问题。在生产中,该项目将运行 5 年,届时数据库中将有 40 亿行。
我想我真正的问题是人们通常如何在 SQL Server 中处理大数据,如何在具有数百万或数十亿行的表上同时管理插入和选择。
最佳答案
您的架构存在一个基本错误,即它没有将历史数据库视为实时数据库。它实际上是,尽管它的名字,因为数据是实时插入的。随心所欲地调用它并拆分插入和更新,但您仍然需要对当前体系结构进行修复。
要解决此问题,您可以从概念上添加/重新配置第三个数据库,这将临时解耦插入。您可以创建一个作业(例如 SSIS 包),在非高峰时间将行批量插入数据库,而不是实时提供历史数据库。这可以是一天一次,比如凌晨 2 点,或者一天中的多次。这取决于您的业务。假设非高峰传输和查询发生在不同的时间,定期批量加载将允许快速批量传输,同时不会减慢对历史数据执行的查询。权衡是您的历史数据不是秒级的,但这可能已经足够了。当然,您需要将实时插入存储在传输之间的某个位置。这就是我提到第三个数据库的原因,但您可以简单地将临时存储折叠到实时数据库中,而不会影响后端用户。
这是经常做的事情,在野外直接回答你的最后一个问题。您通过一些试图避开事务处理和查询的周期传输过程将事务处理数据库(实时数据库)与分析处理(历史、OLAP、数据仓库等)分开,通常通过一些计划任务。您还可以使用队列系统(例如 MSMQ、RabbitMQ 等)作为实时数据库和历史数据库之间的中间存储。这将分离两个数据库,同时还允许更接近实时的历史数据查询可用性。
如果计划的批量传输或队列不是一个可行的选项,您可以去规范化。弄清楚正在收集哪些数据以及如何聚合这些数据,并专门为这些查询创建非规范化表。
祝你好运。
关于.net - 在sql server中管理大数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27161725/
本周我将在 Windows Server 2008 上设置一个专用的 SQL Server 2005 机器,并希望将其精简为尽可能简单,同时仍能发挥全部功能。 为此,“服务器核心”选项听起来很有吸引力
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 这个问题似乎与 help center 中定义的范围内的编程无关。 . 已关闭 8 年前。 Improve
我获取了 2014 版本数据库的备份,并尝试在另一台服务器中将其恢复到具有相同名称和登录名的数据库中。此 SQL Server 版本是 2016。 恢复备份文件时,出现此错误: TITLE: Micr
我获取了 2014 版本数据库的备份,并尝试在另一台服务器中将其恢复到具有相同名称和登录名的数据库中。此 SQL Server 版本是 2016。 恢复备份文件时,出现此错误: TITLE: Micr
TFS 是否提供任何增强的方法来存储对 sql server 数据库所做的更改,而不是使用它来对在数据库上执行的 sql 语句的文本文件进行版本控制? 或者我正在寻找的功能是否仅在第 3 方工具(如
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 9 年前。 Improve this ques
我即将将我的 SQL Server 2012 实例升级到 SQL Server 2014。 我已经克隆了主机 Windows VM 并将其重命名为 foo-2012至 foo-2014 . 重新启动时
我想为 SQL Server 登录授予对数据库的访问权限。我知道 sp_grantdbaccess,但它已被弃用。我可以改用什么以及如何检查登录名是否还没有访问数据库的权限? 场景:UserA 创建数
客户别无选择,只能在接下来的几天内从 sql server 2000 迁移到 2008。测试显示 2005 年的重要功能出现了 Not Acceptable 性能下降,但 2008 年却没有。好消息是
我有一个测试数据库,我需要将其导出到我们客户的测试环境中。 这将是一次性的工作。 我正在使用 SQL Server 2005(我的测试数据库是 SQL Server 2005 Express) 执行此
我需要将一个 CSV 文件导入到 mongoDB 不幸的是我遇到了以下错误: error connecting to host: could not connect to server: se
我以为 R2 是一个补丁/服务包。我一直在寻找下载,但没有看到。因此,我假设 R2 是一个新版本,并且我需要 sqlserver 2008 r2 的安装介质来进行升级? 另外,我需要为新许可证付费吗?
我无法使用 SQL Server Management Studio 连接到 SQL Server。 我有一个连接字符串: 我尝试通过在服务器名中输入 myIP、在登录名中输入 MyID、在密码中
我们希望使用 SQL Server 加密来加密数据库中的几个列。我们还需要在生产和测试环境之间传输数据。看来最好的解决方案是在生产和测试服务器上使用相同的主 key 、证书和对称 key ,以便我可以
有没有可以分析 SQL Server 数据库潜在问题的工具? 例如: a foreign key column that is not indexed 没有 FILL FACTOR 的 uniquei
我正在尝试从我的 SQL 2012 BI 版本建立复制,但我收到一条奇怪的错误消息! "You cannot create a publication from server 'X' because
如果您使用 SQL Server 身份验证 (2005),登录详细信息是否以明文形式通过网络发送? 最佳答案 如您所愿,安全无忧... 您可以相当轻松地配置 SSL,如果您没有受信任的证书,如果您强制
我想将数据从一个表复制到不同服务器之间的另一个表。 如果是在同一服务器和不同的数据库中,我使用了以下 SELECT * INTO DB1..TBL1 FROM DB2..TBL1 (to copy w
我希望得到一些帮助,因为我在这个问题上已经被困了 2 天了! 场景:我可以从我的开发计算机(和其他同事)连接到 SERVER\INSTANCE,但无法从另一个 SQL Server 连接。我得到的错误
我正在尝试从我的 SQL 2012 BI 版本建立复制,但我收到一条奇怪的错误消息! "You cannot create a publication from server 'X' because
我是一名优秀的程序员,十分优秀!