MySQL 对 varchar 字段的部分索引和优化分组-6ren

MySQL 对 varchar 字段的部分索引和优化分组

转载作者：行者123 更新时间：2023-11-29 02:06:10

54

4

我在使用 MySQL 进行组查询时遇到了一些问题。

问题

为什么查询不会在 varchar(255) 字段上使用 10 个字符的部分索引来优化分组依据，这是有原因的吗？

详情

我的设置:

CREATE TABLE `sessions` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `user_id` int(11) DEFAULT NULL,
  `ref_source` varchar(255) COLLATE utf8_unicode_ci DEFAULT NULL,
  `guid` varchar(255) COLLATE utf8_unicode_ci NOT NULL,
  `initial_path` varchar(255) COLLATE utf8_unicode_ci DEFAULT NULL,
  `referrer_host` varchar(255) COLLATE utf8_unicode_ci DEFAULT NULL,
  `campaign` varchar(255) COLLATE utf8_unicode_ci DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `index_sessions_on_user_id` (`user_id`),
  KEY `index_sessions_on_referrer_host` (`referrer_host`(10)),
  KEY `index_sessions_on_initial_path` (`initial_path`(10)),
  KEY `index_sessions_on_campaign` (`campaign`(10))
) ENGINE=InnoDB AUTO_INCREMENT=0 DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci

此处未显示许多列和索引，因为它们不会真正影响问题。

我想做的是运行查询以查看所有引用主机以及来自每个主机的 session 数。我没有一张大 table ，但它足够大，我对全表扫描并不感兴趣。我要运行的查询是:

SELECT COUNT(*) AS count_all, referrer_host AS referrer_host FROM `sessions` GROUP BY referrer_host;

解释给出:

+----+-------------+----------+------+---------------+------+---------+------+--------+---------------------------------+
| id | select_type | table    | type | possible_keys | key  | key_len | ref  | rows   | Extra                           |
+----+-------------+----------+------+---------------+------+---------+------+--------+---------------------------------+
|  1 | SIMPLE      | sessions | ALL  | NULL          | NULL | NULL    | NULL | 303049 | Using temporary; Using filesort |
+----+-------------+----------+------+---------------+------+---------+------+--------+---------------------------------+

我在 referrer_host 上有一个部分索引，但它没有使用它。即使我尝试使用 USE INDEX 或 FORCE INDEX 它也无济于事。解释是一样的，性能也是一样。

如果我在 referrer_host 上添加完整索引，而不是 10 个字符的部分索引，即使不是立即，一切也会更好。 (350 毫秒对 10 秒)

我已经测试了大于该字段中最长条目的部分索引也无济于事。完整索引是唯一似乎有效的方法。

最佳答案

对于全索引，查询将查找扫描整个索引并返回每个唯一键指向的记录数。 table 没有动。

使用部分索引，引擎在查看记录之前不知道 referrer_host 的值。它必须扫描整个表格!

如果 referrer_host 的大部分值都小于 10 个字符，那么理论上，优化器可以使用索引，然后只检查超过 10 个字符的行。但是，因为这不是聚集索引，所以必须进行多次非顺序磁盘读取才能找到这些记录。它最终可能会更慢，因为表扫描至少是顺序读取。优化器不进行假设，而只是进行扫描。

关于MySQL 对 varchar 字段的部分索引和优化分组，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/5588280/

54

4

0

文章推荐： Mysql - 按两列排序

文章推荐： mysql - 在 MySQL 中获取不同值计数的最佳方法

文章推荐： php - 使用mysql搜索多个表？

文章推荐： android - 尝试添加新联系人时如何汇总联系人数据？

typescript - A 部分部分 io-ts
我在使用 io-ts 时遇到一些问题。我发现它确实缺乏文档，我取得的大部分进展都是通过 GitHub issues 取得的。不，我不明白 HKT，所以没有帮助。基本上，我在其他地方创建一个类型，ty
java - 匹配完整文件正则表达式中的 A 部分，但不匹配 B 部分
我必须创建一个正则表达式来搜索整个文件，以找到与 Java XML 解析器的第一部分(但不是第二部分)的匹配项。这将用于防止某些 XXE 攻击。不幸的是，它确实必须是单个正则表达式，并且它确实需要搜索
c# - 部分/部分中的 asp.net mvs 部分？
我有一些简单的 Shared/_Header.cshtml 文件中的内容。 My Shared/_Layout.cshtml 通过调用插入该代码 @Html.Partial("_Header") 目前
java - Selenium 只执行循环的 if != null 部分，不运行循环的 "else if null "部分
我有一个 if-else 语句，其中: 条件 1:ID 匹配并且自动填充某些字段。然后 if 语句只填充其余字段条件 2:ID 不匹配，所有字段均为空白。 ELSE 语句将它们全部填充当我使条件
javascript - 无法在 JSFIDDLE 中使用滚动魔法(第 1 部分，共 2 部分)
我正在开发一个单页滚动网站。我正在尝试实现 ScrollMagic 并固定第一部分，以便网站的其余部分滚动到固定部分的顶部。我尝试创建一个 jsfiddle 来显示问题，但我似乎无法让 jsfiddl
javascript - 既然有

首页

博学

6Ren·AI

商城

MySQL 对 varchar 字段的部分索引和优化分组