mysql - 使用 MySQL/InnoDB 重新平衡表分片-6ren

mysql - 使用 MySQL/InnoDB 重新平衡表分片

转载作者：可可西里更新时间：2023-11-01 06:33:01

25

4

我有一个巨大的 InnoDB 表(>1TB，>1B 行)，我想对其进行分片:我想从那个大表中创建多个较小的独立表。

怎么做？

我已经尝试过的:

通过从原始表中选择行并将它们插入分区来将行移动到分区。这需要很长时间，并且在操作期间保持行同步很困难(但似乎可以使用触发器，只要分区在同一台服务器上)。我还没有找到现成的工具来执行此操作。
复制整个表，然后删除不属于分区的行。仍然很慢，特别是考虑到表格的大小。显然，这就是 MySQL Fabric 所做的。

随机的疯狂想法:

离线拆分.idb文件，并将其导入服务器，但我不知道是否存在能够执行此操作的工具。

显示创建表:

CREATE TABLE `Huge` (
  `account_id` int(11) NOT NULL,
  `id` bigint(20) NOT NULL AUTO_INCREMENT,
  `foo` varchar(255) NOT NULL,
  `bar` int(11) NOT NULL,
  `baz` char(2) NOT NULL,
  PRIMARY KEY (`account_id`,`id`),
  UNIQUE KEY `id` (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 ROW_FORMAT=COMPRESSED;

分片键为 account_id。主键当前为 (account_id,id)，因此行按 account_id 聚类。

是否有任何工具可以自动执行此任务？有更好的方法吗？

最佳答案

“分片”是将数据(通常是一张表)拆分到多个服务器。 “分区”是在同一服务器上将一个表拆分为多个子表。你在做什么？ Fabric 进行分片。您对 .ibd 的评论暗示您正在考虑分区。

假设您要PARTITION 一个巨大的表，我需要先问为什么。这是一个严肃的问题，因为大多数(我的意思是大多数)人认为分区会神奇地产生一些好处，而实际上它不会。我相信有only 4 use cases for partitioning .您的情况是否属于其中任何一个？

另一方面，如果您想要分片，请提供 SHOW CREATE TABLE 并讨论您将在哪个列上分片。

编辑(明确目标后)

我希望你没有明确的FOREIGN KEYs；它们不适用于分区或分片。

`id` bigint(20) NOT NULL AUTO_INCREMENT,
UNIQUE KEY `id` (`id`)

有两个方面的问题。

不需要使idUNIQUE； AUTO_INCREMENT 的唯一要求是它是某个索引中的第一列。所以这会减轻系统的负担:
索引(id)
AUTO_INCREMENT 确实适用于PARTITIONed 表，但不适用于分片表。您需要评估 id 的用途。要么它只在一个分片内是唯一的就可以，那么就没有真正的问题。如果 id 需要在所有分片中都是唯一的，那就更难了。可能唯一的解决方案是拥有一种从某些中央服务器获取 ID 的技术。但是，这会导致单点故障和瓶颈。如果您需要朝那个方向发展，我可以就如何避免这些缺点提出建议。

如何迁移到最终的分片系统？

我不建议离题到 PARTITIONing，从长远来看它不会真正有帮助。 REORGANIZE PARTITION 的成本很高——复制所有行，包括提取的行和剩余的行。 编辑:如果您确实使用了分区，请使用 pt-online-schema-change 以最短的停机时间进行拆分。

相反，我建议完善一种工具，将一个 account_id 从一个分片迁移到另一个分片。这必须是自定义代码，因为可能还有其他表(以及表之间的引用)会受到将帐户移动到不同服务器的影响。从长远来看，这对于负载平衡、硬件升级、软件升级，甚至模式更改都是有用的。当您需要更改某些内容时，使用新的操作系统/版本/模式/任何内容创建一个新的分片，并将用户迁移到它。

这个工具的简单方法是

为那个帐户“阻止”写入
将记录复制到新分片
更改看门人以了解该帐户现在位于新分片上
解锁写入
最终(和 gradually )DELETE 旧分片上的行

如果帐户“小”，这不是什么大问题。但是，如果您需要最短的停机时间(写入受阻)，那么我们可以讨论更复杂的方法。

(如果您没有猜到，我已经“去过那里，做过那件事”。)

关于mysql - 使用 MySQL/InnoDB 重新平衡表分片，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31076437/

25

4

0

文章推荐： MySQL 选择具有相同条件值的前几行

文章推荐： php - innodb_lock_wait_timeout 增加超时

文章推荐： mysql 枚举不区分大小写它匹配第一个不区分大小写

文章推荐： php - 基于分层角色/权限的访问

mysql - 即使启用了 innodb，bugzilla 安装错误 :"InnoDB is disabled your MySQL installation. Bugzilla requires InnoDb to be enabled."
我已经在我的 windows7 机器上安装了 bugzilla4.2.5。当我运行 bugzilla 的 checksetup.pl 脚本时，它显示 Use of uninitialized valu
innodb - 无法删除 MySQL InnoDB 表
我正在使用 MySQL 5.1.56 我有一个包含大约 70 个表的数据库，我有一个特定损坏的表的问题，例如表_X 当我尝试访问表时mysql> 从 Table_x 中选择 *；ERROR 1105
MySQL InnoDB 问题 - InnoDB 注册失败
我最近尝试将 MySQL 5.1 服务器升级到 5.7。当服务器无法启动时，我发现您必须先导出数据，然后再进行大量升级(二进制文件不再可用)，所以我回滚到 5.1 进行导出。问题是，回到 5.1，I
MySQL 默认数据库以及如何使现有的非 InnoDB 成为 InnoDB
我正处于项目的开始阶段，到目前为止我一直在使用默认的 MySQL 数据库。对了，默认的数据库有名字吗？我的问题是如何在不删除当前表和创建新表的情况下将现有表更改为 utf-8 和 InnoDB。是
mysql - Innodb 缓冲池大小变量和 innodb 状态中的缓冲池大小不匹配
我最近尝试将 innodb 缓冲池大小增加到 8GB，但在我的 innodb 状态下，池大小看起来像之前配置的值(在我的例子中是 500MB)。 ---------------------- BUFF
mysql - 在禁用 InnoDB 的情况下将 InnoDB 转换为 MyISAM
我是一家网络酒店的幸运老板，店主会在不知情的情况下更改设置。当这么说时，我的数据库中有一些表正在使用 InnoDB 引擎运行。但是晚上主机禁用了 InnoDB，所以我无法使用 ALTER 命令将其转换
innodb - 除了 mysqldump 之外，是否还需要保存 InnoDB 中的任何二进制文件？
我刚刚将数据库从 MyISAM 引擎迁移到 InnoDB。我使用 mysqldump 备份我的 MyISAM 数据库，但是当我查看 MySQL docs ，对于 InnoDB 表，我还需要保存二进制文
innodb - MySQL InnoDB : cannot calculate statistics because the . ibd 文件丢失
环境: Windows 7(XAMPP 最新版) Apache 2.4.4PHP 5.5MySQL 5.6.11 我正在尝试从 MySQL 5.1 备份数据库并将其导入 MySQL 5.6。在 My
php - MyISAM vs Innodb 和 Innodb 相关表
我正在创建的应用程序主要使用选择，但也有一些是插入、更新等。我想知道在这些情况下哪种性能最好。其次，当我在 innodb 中有两个相关的表时，如果它与另一个表中的行相关，我该如何删除它而不吐出错误？
mysql - MySQL innoDB 页面会在硬盘内碎片化吗？或者 InnoDB 阻止这种情况发生以加快查询速度？
我的意思是页面: https://dev.mysql.com/doc/internals/en/innodb-page-structure.html 这些 16KB 的 MySQL 页面会在内存或磁盘
innodb - mysqldump 备份缺少所有 innodb 表，但没有 MyISAM 表
以下是我使用 mysqldump 备份数据库的开关: /usr/bin/mysqldump -u **** --password=**** --single-transaction --databas
mysql - 事务更新 MyISAM 和 InnoDB 表的 InnoDB 行为
我阅读了本网站上的大部分 InnoDB 示例，但我对 InnoDB 的行为一无所知。据我所知 START TRANSACTION; 声明这是一个事务连接。没关系到这里。现在我有 3 个表: 带有 I
innodb - 使用 MyISAM 和 InnoDB 表备份 MySQL 数据库
我有一个包含混合表(MyISAM、InnoDB)的 MySQL 数据库。如何通过 Linux 命令行使用 mysqldump 创建数据库的完整备份，我应该使用什么选项？最佳答案在下面使用- 所有
optimize insert operation in MySQL (InnoDB)(在MySQL(InnoDB)中优化插入操作)
我有一张桌子：。我用Python在这个表中插入了大约400k行。以下是INSERT语句：。我在两个表tab1.col1和tab2.col2上都有一个索引。但是插入大约需要5分钟/1000行的时间。我从
magento - InnoDB 工作，仍然显示 "Database server does not support InnoDB storage engine message"
我正在尝试使用 WAMP 在本地服务器上安装 Magento。 InnoDB 被设置为默认引擎，但它仍然向我显示消息: Database server does not support InnoDB
mysql - 从 MyISAM 移动到 InnoDb 后，某些表上的 Insert Update 性能降低 InnoDB
我最近将所有表从 MyISAM 移到了 InnoDB，因为我想摆脱大表上的表锁定。在以下表上运行 UPDATE 或 INSERT 查询花费的时间比预期的要多很多。 (约 5 分钟) 我如何优化 in
mysql - InnoDB : Cannot open table from the internal data dictionary of InnoDB though the . 表的 frm 文件存在
我正在运行带有 XAMPP 的 Windows 10 和在本地主机上安装的几十个 Drupal 站点。几个月来一切都运行良好。今天早上，我从两天前的还原点执行了 Windows 还原，以删除不需要的
mysql - AWS 上的 Socialengine 4.8.6(EC2、RDS (MYSQL/INNODB)、S3 和 CLOUDFRONT)- 启动时白屏/可能的 INNODB 问题
Socialengine 4.8.6 - 启动时显示“白屏”，只能通过浏览器访问 sesystem.com/phpmyadmin 和 sesystem.com/install。问题开始:我需要一个包
innodb - 如何预测mysql查询的IO计数？
由于 InnoDB 在 B+ 树中组织其数据。树的高度影响 IO 次数，这可能是 DB 变慢的主要原因之一。所以我的问题是如何断言或计算B+树的高度(例如根据可以通过行大小、页面大小和行号计算的页数
innodb - 恢复后mysqldump数据丢失
我尝试使用 mysqldump 从系统 A 使用 innodb 默认存储引擎将大约 40gb 的数据库 db1 转储到 sql 文件中，并尝试在另一个系统 B 上恢复它。两者都有默认存储引擎 inno

首页

博学

6Ren·AI

商城

mysql - 使用 MySQL/InnoDB 重新平衡表分片