- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
假设我有一个表(我们称之为 BigTable
),每天可能会经历5,000,000 次插入(可能还有同样多的 SELECT)。每插入行约 50kb。
这些每日插入平均分配给 5 个客户端(该表有一个名为 ClientID
的 FK)。永远不需要跨多个客户端选择或连接数据。
我担心随着该表的增长,数据库性能会受到影响,因此我想出了两种解决方案。
解决方案 1:
ClientID
对 BigTable
进行分区本质上,这意味着它们自己的存储设备上的以下分区:
BigTable
之外的所有数据)BigTable
(每天 5,000,000 行/5 个客户端 x 30 天 = 30,000,000 行)BigTable
(30,000,000 行)BigTable
(30,000,000 行)BigTable
(30,000,000 行)BigTable
(30,000,000 行)BigTable
存档BigTable
存档BigTable
存档BigTable
存档BigTable
存档存档表中的行数将为 (5,000,000) x(数据库生命周期,以天为单位)- (30,000,000)。这仍然是一个巨大的表,但只会用于起草奇怪的报告。
SQL Server 将托管在 14GB、8 核 Azure VM 上。
解决方案 2:
另一个选项是为每个客户端托管单独的数据库。这意味着每个服务器都将拥有自己专用的 SQL Server 计算机。归档数据仍然会发生分区。
由于数据的物理分离,此选项不是最佳选择。必须管理多个数据库的更新可能会带来很大的问题。为每个客户端提供单独的数据库连接也是开发人员的一个考虑因素。
有人可以就这些选项提出建议吗?
最佳答案
由于您已使用 [azure] 和 [sql-server] 标记此操作,因此我假设您正在尝试在 Windows Azure 中执行此操作。如果是这种情况,那么 a) 按客户端分区不一定是个好主意,并且 b) SQL 可能不是最(完整)适合您的问题的。
在构建可扩展架构时,分区策略不应基于“客户端”等特定内容,而应基于更任意的内容。原因很简单 - 除非客户端有理由分开,例如不希望其数据与其他数据混合,或者每个客户端有不同的 SLA,否则选择“客户端”作为分区可能不会呈现最佳结果。如果您 80% 的业务是由单个客户产生的,那么您还没有解决问题,并且仍然需要维护n 个单独的数据库来承受边际负载。
每天 500 万次数据库插入并不是一个大数字,但对于 Azure IaaS 或 Azure SQL 数据库中托管的 SQL Server 来说可能是一个大数字 - 由于底层商用硬件的性能。在确定如何对 SQL 进行分区之前,先问自己两个问题。首先,您希望从数据中获得哪些用途和性能特征? (它必须立即一致吗?您可以异步处理数据吗?)其次,您是否将这些特征与其他数据存储技术进行了映射?您是否考虑过表存储(或 Redis 等非 MS 解决方案)?
在尝试了几个选项后,您可能会发现:
例如,我有一个以一秒为间隔跟踪车辆的应用程序。它的目标是 100,000 辆汽车,但其架构设计方式是能够在不更改任何代码或数据库的情况下扩展到数百万辆汽车。但从中期来看,它每天必须处理 7200 万次插入。所有这些都运行在一个小于 10GB 的 Windows Azure SQL 数据库和一大堆表存储上。这样做的原因是,虽然我想归档所有数据(7200 万行),但我不需要对其进行复杂的 SQL 查询访问,因此它可以轻松地存放在表存储中。我在 SQL 中存储的是数据的摘要。因此,在我的示例中,我只对车辆的行程(起点和终点位置、行驶距离等)感兴趣,这意味着我每天在 SQL 中只需要每辆车两到三行 — 大大减少了负载数据库。另外,我的瓶颈在于数据收集,因此我立即将数据添加到 (Windows Azure) 队列 - 并担心在单独的工作负载中汇总数据。
这个答案可能有点长,但目的是让你更仔细地思考你的数据模型,而不是仅仅试图思考如何用 SQL 解决问题。有关更多详细信息,请查看 CALM 中的数据模型。 .
关于sql-server - 使用分区或单独的数据库进行表扩展?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14938598/
本周我将在 Windows Server 2008 上设置一个专用的 SQL Server 2005 机器,并希望将其精简为尽可能简单,同时仍能发挥全部功能。 为此,“服务器核心”选项听起来很有吸引力
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 这个问题似乎与 help center 中定义的范围内的编程无关。 . 已关闭 8 年前。 Improve
我获取了 2014 版本数据库的备份,并尝试在另一台服务器中将其恢复到具有相同名称和登录名的数据库中。此 SQL Server 版本是 2016。 恢复备份文件时,出现此错误: TITLE: Micr
我获取了 2014 版本数据库的备份,并尝试在另一台服务器中将其恢复到具有相同名称和登录名的数据库中。此 SQL Server 版本是 2016。 恢复备份文件时,出现此错误: TITLE: Micr
TFS 是否提供任何增强的方法来存储对 sql server 数据库所做的更改,而不是使用它来对在数据库上执行的 sql 语句的文本文件进行版本控制? 或者我正在寻找的功能是否仅在第 3 方工具(如
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 9 年前。 Improve this ques
我即将将我的 SQL Server 2012 实例升级到 SQL Server 2014。 我已经克隆了主机 Windows VM 并将其重命名为 foo-2012至 foo-2014 . 重新启动时
我想为 SQL Server 登录授予对数据库的访问权限。我知道 sp_grantdbaccess,但它已被弃用。我可以改用什么以及如何检查登录名是否还没有访问数据库的权限? 场景:UserA 创建数
客户别无选择,只能在接下来的几天内从 sql server 2000 迁移到 2008。测试显示 2005 年的重要功能出现了 Not Acceptable 性能下降,但 2008 年却没有。好消息是
我有一个测试数据库,我需要将其导出到我们客户的测试环境中。 这将是一次性的工作。 我正在使用 SQL Server 2005(我的测试数据库是 SQL Server 2005 Express) 执行此
我需要将一个 CSV 文件导入到 mongoDB 不幸的是我遇到了以下错误: error connecting to host: could not connect to server: se
我以为 R2 是一个补丁/服务包。我一直在寻找下载,但没有看到。因此,我假设 R2 是一个新版本,并且我需要 sqlserver 2008 r2 的安装介质来进行升级? 另外,我需要为新许可证付费吗?
我无法使用 SQL Server Management Studio 连接到 SQL Server。 我有一个连接字符串: 我尝试通过在服务器名中输入 myIP、在登录名中输入 MyID、在密码中
我们希望使用 SQL Server 加密来加密数据库中的几个列。我们还需要在生产和测试环境之间传输数据。看来最好的解决方案是在生产和测试服务器上使用相同的主 key 、证书和对称 key ,以便我可以
有没有可以分析 SQL Server 数据库潜在问题的工具? 例如: a foreign key column that is not indexed 没有 FILL FACTOR 的 uniquei
我正在尝试从我的 SQL 2012 BI 版本建立复制,但我收到一条奇怪的错误消息! "You cannot create a publication from server 'X' because
如果您使用 SQL Server 身份验证 (2005),登录详细信息是否以明文形式通过网络发送? 最佳答案 如您所愿,安全无忧... 您可以相当轻松地配置 SSL,如果您没有受信任的证书,如果您强制
我想将数据从一个表复制到不同服务器之间的另一个表。 如果是在同一服务器和不同的数据库中,我使用了以下 SELECT * INTO DB1..TBL1 FROM DB2..TBL1 (to copy w
我希望得到一些帮助,因为我在这个问题上已经被困了 2 天了! 场景:我可以从我的开发计算机(和其他同事)连接到 SERVER\INSTANCE,但无法从另一个 SQL Server 连接。我得到的错误
我正在尝试从我的 SQL 2012 BI 版本建立复制,但我收到一条奇怪的错误消息! "You cannot create a publication from server 'X' because
我是一名优秀的程序员,十分优秀!