gpt4 book ai didi

创建和删除索引后 MySQL 性能提升

转载 作者:行者123 更新时间:2023-11-29 01:04:13 24 4
gpt4 key购买 nike

我有一个大型 MySQL、MyISAM 表,大约有 400 万行,在 core 2 duo、8G RAM 笔记本电脑上运行。

这个表有30列,包括varchar、decimal和int类型。

我在 varchar(16) 上有一个索引。我们称此列为:“indexed_varchar_column”。

我的查询是

SELECT 9 columns FROM the_table WHERE indexed_varchar_column = 'something';

对于我查询的每个“内容”,它总是返回大约 5000 行。

查询的 EXPLAIN 返回:

+----+-------------+-------------+------+----------------------------------------------------+--------------------------------------------+---------+-------+------+-------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+-------------+------+----------------------------------------------------+--------------------------------------------+---------+-------+------+-------------+
| 1 | SIMPLE | the_table | ref | many indexes including indexed_varchar_column | another_index NOT: indexed_varchar_column! | 19 | const | 5247 | Using where |
+----+-------------+-------------+------+----------------------------------------------------+--------------------------------------------+---------+-------+------+-------------+

首先,我不确定为什么选择 another_index。事实上,它选择的索引是 indexed_varchar_column 和另外 2 列(构成所选列的一部分)的复合索引。也许这是有道理的,因为不必读取查询中的 2 列可能会使事情变得更快一些。真正的问题是以下问题:

对于我匹配的每个“东西”,查询需要 5 秒。第二次我查询“某事”需要 0.15 秒(我猜是因为查询正在被缓存)。当我针对“something_new”运行另一个查询时,它又需要 5 秒。所以,它是一致的。

问题是:我发现创建一个索引(另一个复合索引,包括我的 indexed_varchar_column)并再次删除它会导致所有针对新“something_other”的进一步查询只需要 0.15 秒。请注意 1) 我创建了一个索引 2) 再次删除它。所以一切都处于相同的状态。

我想构建和删除索引所需的所有操作都会使 SQL 引擎缓存一些内容,然后再使用这些内容。当我在所有这些之后对查询运行 EXPLAIN 时,我得到的结果与以前完全相同。

我如何继续了解在创建-删除索引过程中缓存的内容,以便我可以在不操作索引的情况下缓存它?

更新:

根据 Marc B 的评论,建议当 mySQL 创建索引时,它在内部执行 SELECT... 我尝试了以下操作:

SELECT * FROM my_table;

用了 30 秒,返回了 400 万行。好消息是所有进一步的查询再次非常快(直到我重新启动系统)。请注意,重新启动后查询再次变慢。我猜这是因为 mySQL 正在使用某种操作系统缓存。

有什么想法吗?如何显式缓存我猜测的表?

更新 2:也许我应该提到这张表可能严重碎片化。它有 400 万行,但我会定期删除很多旧字段。我也添加新的。由于我每天的 ID(对于已删除的行)都有很大的差距,所以我删除了主索引 (ID) 并使用连续的数字再次创建它。该表可能会非常零散,因此 IO 一定是个问题...不知道该怎么做。

最佳答案

感谢大家的帮助。

最后我发现(感谢 Marc B 的提示)我的表在多次 INSERT 和 DELETE 之后严重碎片化。几个小时前我用这个信息更新了问题。有两件事有帮助:

1)

ALTER TABLE my_table ORDER BY indexed_varchar_column;

2)运行:

myisamchk --sort-records=4 my_table.MYI  (where 4 corresponds to my index)

我相信这两个命令是等价的。即使在系统重新启动后查询也很快。我已将此 A​​LTER TABLE ORDER BY 命令放在每天运行的 cron 上。这需要 2 分钟,但值得。

关于创建和删除索引后 MySQL 性能提升,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12354153/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com