gpt4 book ai didi

Mysql分区索引

转载 作者:行者123 更新时间:2023-11-29 03:41:26 24 4
gpt4 key购买 nike

我想从批处理数据创建一个表用于数据挖掘。我每天将有大约 2500 万行数据进入此表。表上定义了几个索引,所以插入(我是批量插入)速度很慢。没有索引我可以坚持 40K 行,而有索引它更像是 3-4 K,这使得整个事情变得不可行。所以想法是按天对数据进行分区,禁用键,然后进行当天的插入,并重新启用索引。对一天的数据重新启用索引大约需要 20 分钟,这很好。这让我想到了我的问题。当您重新启用索引时,它是否必须重新计算所有部分的索引,还是仅针对那一天?很明显,对于分区所在的索引(在本例中为日期),它应该仅针对那一天。但是其他指数呢?如果需要重新计算所有分区的索引,则无法在合理的时间内完成。有人知道吗?

显示创建是这样的:

sts | CREATE TABLE `sts` (
`userid` int(10) unsigned DEFAULT NULL,
`urlid` int(10) unsigned DEFAULT NULL,
`geoid` mediumint(8) unsigned DEFAULT NULL,
`cid` mediumint(8) unsigned DEFAULT NULL,
`m` smallint(5) unsigned DEFAULT NULL,
`t` smallint(5) unsigned DEFAULT NULL,
`d` tinyint(3) unsigned DEFAULT NULL,
`requested` int(10) unsigned DEFAULT NULL,
`rate` tinyint(4) DEFAULT NULL,
`mode` varchar(12) DEFAULT NULL,
`session` smallint(5) unsigned DEFAULT NULL,
`sins` smallint(5) unsigned DEFAULT NULL,
`tos` mediumint(8) unsigned DEFAULT NULL,
PRIMARY KEY (userid, urlid, requested),
KEY `id_index` (`m`),
KEY `id_index2` (`t`)
) ENGINE=MyISAM DEFAULT CHARSET=latin1

当前未分区。

最佳答案

您在 上禁用/启用索引。这意味着将在表的所有部分禁用/启用索引。

考虑这种加载新数据的场景:

  1. 创建一个临时表,定义您需要的所有分区
  2. 将数据加载到没有索引的暂存表中。
  3. 在此表上创建索引。
  4. 将分区移动到目标表,该表的分区与暂存表相同。
  5. 删除暂存表上的索引

要以可控方式对现有数据进行分区,您可以使用相同的逻辑将数据移动到新的分区表。

关于Mysql分区索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13384343/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com