gpt4 book ai didi

mysql - FULLTEXT 索引需要更长的时间来执行

转载 作者:行者123 更新时间:2023-11-28 23:22:56 27 4
gpt4 key购买 nike

下面的查询需要 1.1s 来执行,EXPLAIN 显示了 FULLTEXT 索引的使用:

SELECT SQL_NO_CACHE COUNT(*)
FROM e_entity
WHERE meta_oid=336799 AND MATCH(sIndex07) AGAINST ("#UPR-1393#" IN NATURAL LANGUAGE MODE)

EXPLAIN:
id: 1
select_type: SIMPLE
table: e_entity
type: fulltext
possible_keys: App_Parent,sindex07
key: sIndex07
key_len: 0
ref: (NULL)
rows: 1
extra: Using Where

sIndex07 列上有一个FULLTEXT 索引。然而,当此 FULLTEXT 索引被删除并替换为通常的 KEY 索引时,查询:

SELECT SQL_NO_CACHE COUNT(*)
FROM e_entity
WHERE meta_oid=336799 AND sIndex07 LIKE "%#UPR-1393#%"

EXPLAIN:
id: 1
select_type: SIMPLE
table: e_entity
type: ref
possible_keys: App_Parent
key: App_Parent
key_len: 4
ref: const
rows: 331283
extra: Using Where

CREATE TABLE `e_entity` (
`OID` int(11) NOT NULL AUTO_INCREMENT,
`E_E_OID` int(11) DEFAULT NULL,
`UNIQUE_IDX` int(11) NOT NULL,
`APP_OID` int(11) NOT NULL,
`META_OID` int(11) NOT NULL,
`STORE_DATE` datetime NOT NULL,
`REL_DISPLAY` varchar(1024) NOT NULL,
`sIndex01` varchar(1024) NOT NULL,
`SINDEX02` varchar(1024) NOT NULL,
`SINDEX03` varchar(1024) NOT NULL,
`SINDEX04` varchar(1024) NOT NULL,
`SINDEX05` varchar(1024) NOT NULL,
`SINDEX06` varchar(1024) NOT NULL,
`sIndex07` varchar(1024) NOT NULL,
`SINDEX08` varchar(1024) NOT NULL,
`SINDEX09` varchar(1024) NOT NULL,
`sIndex10` varchar(1022) NOT NULL,
`SINDEX11` varchar(1024) NOT NULL,
`SINDEX12` varchar(1024) NOT NULL,
`SINDEX13` varchar(1024) NOT NULL,
`SINDEX14` varchar(1024) NOT NULL,
`sIndex15` varchar(1022) NOT NULL,
`SINDEX16` varchar(1024) NOT NULL,
`SINDEX17` varchar(1024) NOT NULL,
`SINDEX18` varchar(1024) NOT NULL,
`SINDEX19` varchar(1024) NOT NULL,
`SINDEX20` varchar(1024) NOT NULL,
`NINDEX01` double NOT NULL,
`NINDEX02` double NOT NULL,
`NINDEX03` double NOT NULL,
`NINDEX04` double NOT NULL,
`NINDEX05` double NOT NULL,
`NINDEX06` double NOT NULL,
`NINDEX07` double NOT NULL,
`NINDEX08` double NOT NULL,
`NINDEX09` double NOT NULL,
`NINDEX10` double NOT NULL,
`DINDEX01` datetime NOT NULL,
`DINDEX02` datetime NOT NULL,
`DINDEX03` datetime NOT NULL,
`DINDEX04` datetime NOT NULL,
`DINDEX05` datetime NOT NULL,
`DINDEX06` datetime NOT NULL,
`DINDEX07` datetime NOT NULL,
`DINDEX08` datetime NOT NULL,
`DINDEX09` datetime NOT NULL,
`DINDEX10` datetime NOT NULL,
`FREETEXT` mediumtext NOT NULL,
`UID` int(11) DEFAULT NULL,
PRIMARY KEY (`OID`),
KEY `E_E_OID` (`E_E_OID`),
KEY `sIndex01` (`SINDEX01`),
KEY `sIndex02` (`SINDEX02`),
KEY `sIndex03` (`SINDEX03`),
KEY `sIndex04` (`SINDEX04`),
KEY `sIndex05` (`SINDEX05`),
KEY `sIndex06` (`SINDEX06`),
FULLTEXT `sIndex07` (`SINDEX07`),
KEY `sIndex08` (`SINDEX08`),
KEY `sIndex09` (`SINDEX09`),
KEY `sIndex10` (`SINDEX10`),
KEY `sIndex11` (`SINDEX11`),
KEY `sIndex12` (`SINDEX12`),
KEY `sIndex13` (`SINDEX13`),
KEY `sIndex14` (`SINDEX14`),
KEY `sIndex15` (`SINDEX15`),
KEY `sIndex16` (`SINDEX16`),
KEY `sIndex17` (`SINDEX17`),
KEY `sIndex18` (`SINDEX18`),
KEY `sIndex19` (`SINDEX19`),
KEY `sIndex20` (`SINDEX20`),
KEY `dIndex01` (`DINDEX01`),
KEY `dIndex02` (`DINDEX02`),
KEY `dIndex03` (`DINDEX03`),
KEY `dIndex04` (`DINDEX04`),
KEY `dIndex05` (`DINDEX05`),
KEY `dIndex06` (`DINDEX06`),
KEY `dIndex07` (`DINDEX07`),
KEY `dIndex08` (`DINDEX08`),
KEY `dIndex09` (`DINDEX09`),
KEY `dIndex10` (`DINDEX10`),
KEY `nIndex01` (`NINDEX01`),
KEY `nIndex02` (`NINDEX02`),
KEY `nIndex03` (`NINDEX03`),
KEY `nIndex04` (`NINDEX04`),
KEY `nIndex05` (`NINDEX05`),
KEY `nIndex06` (`NINDEX06`),
KEY `nIndex07` (`NINDEX07`),
KEY `nIndex08` (`NINDEX08`),
KEY `nIndex09` (`NINDEX09`),
KEY `nIndex10` (`NINDEX10`),
KEY `rel_display` (`REL_DISPLAY`),
KEY `App_Parent` (`META_OID`),
) ENGINE=InnoDB AUTO_INCREMENT=1245843 DEFAULT CHARSET=utf8 ROW_FORMAT=COMPRESSED

仅需 0.6 秒即可完成。我在其他问题中看到 MATCH 子句需要嵌套,但我不确定如何将它嵌套在 COUNT 语句中。此外,当删除 meta_oid 子句时,使用 FULLTEXT 索引运行的查询比第二个查询快 50%,因此看起来 FULLTEXT 是作为一个好处,我在将它与查询的其余部分结合使用时遇到了困难。meta_oid 已编入索引,sIndex07varchar(1024)数据库大小为 4.5Gb。

编辑:FULLTEXT 搜索速度较慢的原因是搜索词中有一个连字符,因此在我的特定情况下返回的数据集比 LIKE 运算符大得多。没有连字符的搜索确实使用 FULLTEXT 并且比 LIKE

执行大约一百倍

我将在不到 24 小时内奖励那些可以使用连字符进行搜索而无需重新编译 mysql 二进制文件的人,从而使 FULLTEXT 更快,这是问题的最初目的。

最佳答案

MySQL 使用查询规划器来确定如何最好地解决查询。通常,只有一个索引用于解析“WHERE”组件,并且它是从可能适用的可能索引列表中选择的。可能的索引列表由 EXPLAIN 在 possible_keys 下显示,所选索引由 key 标识。为了做出选择,MySQL 会查看许多因素,例如索引的唯一性,以尝试确定哪个索引最能缩小可能结果列表的范围。

一旦它缩小了索引中匹配的行列表。它将 Use Where 读取这些行并根据 WHERE 子句中的其余条件检查它们。

在这个操作中有很多边缘情况,有时 MySQL 会做出糟糕的选择。查询规划器在 MySQL 5.1 中发生了显着变化,并且在它再次变得良好之前发布了几个版本。

如果没有检查数据,很难说明 MySQL 做出错误选择的原因。尽管在做:

SELECT SQL_NO_CACHE COUNT(*)
FROM e_entity
WHERE MATCH(sIndex07) AGAINST ("#UPR-1393#" IN NATURAL LANGUAGE MODE);

会告诉您 MySQL 使用全文索引从数据库中读取了多少行。在您的原始查询中,它必须根据“meta_oid=336799”解析所有这些行以确定最终计数。

SELECT SQL_NO_CACHE COUNT(*)
FROM e_entity
WHERE meta_oid=336799

会告诉您 MySQL 使用 META_OID 上的 App_Parent 索引读取了多少实际行。在您的第二个查询中,它必须根据 LIKE "%#UPR-1393#%"

解析这些行

如果后一个查询产生的数字比第一个小得多,那么它就可以解释为什么使用 App_Parent 而不是全文索引会更快。

关于mysql - FULLTEXT 索引需要更长的时间来执行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40736442/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com