sql-server - 使用分区或单独的数据库进行表扩展？-6ren

sql-server - 使用分区或单独的数据库进行表扩展？

转载作者：行者123 更新时间：2023-12-02 06:37:26

26

4

假设我有一个表(我们称之为 BigTable)，每天可能会经历5,000,000 次插入(可能还有同样多的 SELECT)。每插入行约 50kb。

这些每日插入平均分配给 5 个客户端(该表有一个名为 ClientID 的 FK)。永远不需要跨多个客户端选择或连接数据。

我担心随着该表的增长，数据库性能会受到影响，因此我想出了两种解决方案。

解决方案 1:

按 ClientID 对 BigTable 进行分区
将每个分区存储在服务器上的单独硬盘上(使用 Azure 博客存储)。
将 1 个月前的所有数据(归档数据，但仍需要可查询)分区到另一组 READONLY 分区中。

本质上，这意味着它们自己的存储设备上的以下分区:

主要(除 BigTable 之外的所有数据)
ClientA 的 BigTable(每天 5,000,000 行/5 个客户端 x 30 天 = 30,000,000 行)
ClientB 的 BigTable(30,000,000 行)
ClientC 的 BigTable(30,000,000 行)
ClientD 的 BigTable(30,000,000 行)
ClientE 的 BigTable(30,000,000 行)
ClientA 的 BigTable 存档
ClientB 的 BigTable 存档
ClientC 的 BigTable 存档
ClientD 的 BigTable 存档
ClientE 的 BigTable 存档

存档表中的行数将为 (5,000,000) x(数据库生命周期，以天为单位)- (30,000,000)。这仍然是一个巨大的表，但只会用于起草奇怪的报告。

SQL Server 将托管在 14GB、8 核 Azure VM 上。

解决方案 2:

另一个选项是为每个客户端托管单独的数据库。这意味着每个服务器都将拥有自己专用的 SQL Server 计算机。归档数据仍然会发生分区。

由于数据的物理分离，此选项不是最佳选择。必须管理多个数据库的更新可能会带来很大的问题。为每个客户端提供单独的数据库连接也是开发人员的一个考虑因素。

有人可以就这些选项提出建议吗？

最佳答案

由于您已使用 [azure] 和 [sql-server] 标记此操作，因此我假设您正在尝试在 Windows Azure 中执行此操作。如果是这种情况，那么 a) 按客户端分区不一定是个好主意，并且 b) SQL 可能不是最(完整)适合您的问题的。

在构建可扩展架构时，分区策略不应基于“客户端”等特定内容，而应基于更任意的内容。原因很简单 - 除非客户端有理由分开，例如不希望其数据与其他数据混合，或者每个客户端有不同的 SLA，否则选择“客户端”作为分区可能不会呈现最佳结果。如果您 80% 的业务是由单个客户产生的，那么您还没有解决问题，并且仍然需要维护n 个单独的数据库来承受边际负载。

每天 500 万次数据库插入并不是一个大数字，但对于 Azure IaaS 或 Azure SQL 数据库中托管的 SQL Server 来说可能是一个大数字 - 由于底层商用硬件的性能。在确定如何对 SQL 进行分区之前，先问自己两个问题。首先，您希望从数据中获得哪些用途和性能特征？ (它必须立即一致吗？您可以异步处理数据吗？)其次，您是否将这些特征与其他数据存储技术进行了映射？您是否考虑过表存储(或 Redis 等非 MS 解决方案)？

在尝试了几个选项后，您可能会发现:

在某些时候，SQL 可以很好地存储某些数据。
大部分处理可以异步完成，因此插入的峰值性能并不重要(并且在 24 小时内执行 500 万次插入也不是问题)。
SQL 可能不适合长期存储。
可以使用 Map-Reduce(而不是 SQL 查询)有效地查询旧数据。

例如，我有一个以一秒为间隔跟踪车辆的应用程序。它的目标是 100,000 辆汽车，但其架构设计方式是能够在不更改任何代码或数据库的情况下扩展到数百万辆汽车。但从中期来看，它每天必须处理 7200 万次插入。所有这些都运行在一个小于 10GB 的 Windows Azure SQL 数据库和一大堆表存储上。这样做的原因是，虽然我想归档所有数据(7200 万行)，但我不需要对其进行复杂的 SQL 查询访问，因此它可以轻松地存放在表存储中。我在 SQL 中存储的是数据的摘要。因此，在我的示例中，我只对车辆的行程(起点和终点位置、行驶距离等)感兴趣，这意味着我每天在 SQL 中只需要每辆车两到三行 — 大大减少了负载数据库。另外，我的瓶颈在于数据收集，因此我立即将数据添加到 (Windows Azure) 队列 - 并担心在单独的工作负载中汇总数据。

这个答案可能有点长，但目的是让你更仔细地思考你的数据模型，而不是仅仅试图思考如何用 SQL 解决问题。有关更多详细信息，请查看 CALM 中的数据模型。 .

关于sql-server - 使用分区或单独的数据库进行表扩展？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/14938598/

26

4

0

文章推荐： Facebook Like 按钮不在任何浏览器中显示/显示

文章推荐： objective-c - memcpy 会正确复制字符串吗？

文章推荐： ruby-on-rails - 缺少当前文件夹 Capistrano Rails 3.2

sql-server - Windows Server 2008 "Server Core"是否适合 SQL Server 实例？
本周我将在 Windows Server 2008 上设置一个专用的 SQL Server 2005 机器，并希望将其精简为尽可能简单，同时仍能发挥全部功能。为此，“服务器核心”选项听起来很有吸引力
sql-server - 我可以随我的应用程序一起分发和安装 SQL Server Server 管理对象吗？
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。这个问题似乎与 help center 中定义的范围内的编程无关。 . 已关闭 8 年前。 Improve
sql-server - 如何将SQL Server 2014数据库备份恢复到SQL Server 2016？
我获取了 2014 版本数据库的备份，并尝试在另一台服务器中将其恢复到具有相同名称和登录名的数据库中。此 SQL Server 版本是 2016。恢复备份文件时，出现此错误: TITLE: Micr
sql-server - 如何将SQL Server 2014数据库备份恢复到SQL Server 2016？
我获取了 2014 版本数据库的备份，并尝试在另一台服务器中将其恢复到具有相同名称和登录名的数据库中。此 SQL Server 版本是 2016。恢复备份文件时，出现此错误: TITLE: Micr
sql-server - Team Foundation Server - Sql Server 版本管理
TFS 是否提供任何增强的方法来存储对 sql server 数据库所做的更改，而不是使用它来对在数据库上执行的 sql 语句的文本文件进行版本控制？或者我正在寻找的功能是否仅在第 3 方工具(如
sql-server - SQL Server 索引最佳实践 (SQL Server 2008)
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 9 年前。 Improve this ques
sql-server - 重命名 SQL Server 主机后更新 sys.servers
我即将将我的 SQL Server 2012 实例升级到 SQL Server 2014。我已经克隆了主机 Windows VM 并将其重命名为 foo-2012至 foo-2014 . 重新启动时
sql-server - 授予 SQL Server 登录数据库访问权限 - SQL Server
我想为 SQL Server 登录授予对数据库的访问权限。我知道 sp_grantdbaccess，但它已被弃用。我可以改用什么以及如何检查登录名是否还没有访问数据库的权限？场景:UserA 创建数
sql-server - 是否可以将数据从sql server 2005 中的表恢复到sql server 2008？
客户别无选择，只能在接下来的几天内从 sql server 2000 迁移到 2008。测试显示 2005 年的重要功能出现了 Not Acceptable 性能下降，但 2008 年却没有。好消息是
sql-server - 将数据库从一个 SQL Server 导出到另一个 SQL Server
我有一个测试数据库，我需要将其导出到我们客户的测试环境中。这将是一次性的工作。我正在使用 SQL Server 2005(我的测试数据库是 SQL Server 2005 Express) 执行此
mongodb - 连接到主机时出错 : could not connect to server: server selection error: server selection timeout current topology: Type: Single Servers
我需要将一个 CSV 文件导入到 mongoDB 不幸的是我遇到了以下错误: error connecting to host: could not connect to server: se
sql-server-2008 - 从sql server 2008升级到sql server 2008 R2
我以为 R2 是一个补丁/服务包。我一直在寻找下载，但没有看到。因此，我假设 R2 是一个新版本，并且我需要 sqlserver 2008 r2 的安装介质来进行升级？另外，我需要为新许可证付费吗？
sql-server - SQL server management studio - 如何使用连接字符串连接到 SQL server？
我无法使用 SQL Server Management Studio 连接到 SQL Server。我有一个连接字符串: 我尝试通过在服务器名中输入 myIP、在登录名中输入 MyID、在密码中
sql-server - 如何在一台 SQL Server 上加密并在另一台 SQL Server 上解密？
我们希望使用 SQL Server 加密来加密数据库中的几个列。我们还需要在生产和测试环境之间传输数据。看来最好的解决方案是在生产和测试服务器上使用相同的主 key 、证书和对称 key ，以便我可以
sql-server - FxCop for SQL Server - 分析 SQL Server 数据库潜在问题的工具
有没有可以分析 SQL Server 数据库潜在问题的工具？例如: a foreign key column that is not indexed 没有 FILL FACTOR 的 uniquei
sql-server - 创建复制错误 : You cannot create a publication from server 'X' because the server is too old
我正在尝试从我的 SQL 2012 BI 版本建立复制，但我收到一条奇怪的错误消息! "You cannot create a publication from server 'X' because
sql-server - SQL Server 2005 : How Secure is SQL Server Authentication?
如果您使用 SQL Server 身份验证 (2005)，登录详细信息是否以明文形式通过网络发送？最佳答案如您所愿，安全无忧... 您可以相当轻松地配置 SSL，如果您没有受信任的证书，如果您强制
sql-server - 将数据从一个 SQL Server 数据库表复制到另一个 SQL Server 数据库表
我想将数据从一个表复制到不同服务器之间的另一个表。如果是在同一服务器和不同的数据库中，我使用了以下 SELECT * INTO DB1..TBL1 FROM DB2..TBL1 (to copy w
sql-server - 无法从另一个 SQL Server 连接到 SQL Server 命名实例
我希望得到一些帮助，因为我在这个问题上已经被困了 2 天了! 场景:我可以从我的开发计算机(和其他同事)连接到 SERVER\INSTANCE，但无法从另一个 SQL Server 连接。我得到的错误
sql-server - 创建复制错误 : You cannot create a publication from server 'X' because the server is too old
我正在尝试从我的 SQL 2012 BI 版本建立复制，但我收到一条奇怪的错误消息! "You cannot create a publication from server 'X' because

首页

博学

6Ren·AI

商城

sql-server - 使用分区或单独的数据库进行表扩展？