MySQL:分组/有序/左连接查询非常慢-6ren

MySQL:分组/有序/左连接查询非常慢

转载作者：可可西里更新时间：2023-11-01 06:30:34

29

4

我的查询有一个问题，它花费的时间太长(仅仅这个简单的查询就超过了两秒)。

乍一看，这似乎是一个索引问题，所有连接的字段都已编入索引，但我找不到其他我可能需要编入索引以加快速度的内容。一旦我将我需要的字段添加到查询中，它就会变得更慢。

SELECT  `jobs`.`job_id` AS  `job_id` FROM tabledef_Jobs AS jobs
 LEFT JOIN tabledef_JobCatLink AS jobcats ON jobs.job_id = jobcats.job_id
 LEFT JOIN tabledef_Applications AS apps ON jobs.job_id = apps.job_id
 LEFT JOIN tabledef_Companies AS company ON jobs.company_id = company.company_id
GROUP BY  `jobs`.`job_id` 
ORDER BY  `jobs`.`date_posted` ASC
LIMIT 0 , 50

表行数 (~):tabledef_Jobs (108k)、tabledef_JobCatLink (109k)、tabledef_Companies (100)、tabledef_Applications (50k)

在这里你可以看到Describe。 “使用临时”似乎是减慢查询速度的原因:

enter image description here

表格索引截图:

enter image description here

任何帮助将不胜感激

用答案编辑

感谢@Steve(标记答案)，最终改进了查询。最终，最终查询从 ~22s 减少到 ~0.3s:

SELECT `jobs`.`job_id` AS `job_id` FROM
(
 SELECT * FROM tabledef_Jobs as jobs ORDER BY `jobs`.`date_posted` ASC LIMIT 0 , 50
) AS jobs
 LEFT JOIN tabledef_JobCatLink AS jobcats ON jobs.job_id = jobcats.job_id
 LEFT JOIN tabledef_Applications AS apps ON jobs.job_id = apps.job_id
 LEFT JOIN tabledef_Companies AS company ON jobs.company_id = company.company_id
GROUP BY  `jobs`.`job_id` 
ORDER BY  `jobs`.`date_posted` ASC
LIMIT 0 , 50

最佳答案

好的，我会尝试一下。

查询优化器似乎无法使用索引来完成对 tabledef_Jobs 表的查询。

你有一个偏移量限制，这与你的 ORDER BY 的组合不能在加入之前限制数据量，因此它必须按 job_id 分组，这是一个 PK 和快速 - 但然后订购该数据(临时表和文件排序)，然后限制和丢弃大部分数据，然后最终将其他所有数据加入其中。

我建议，为“job_id, date_posted”的职位添加一个复合索引

所以首先优化基础查询:

SELECT * FROM tabledef_Jobs 
GROUP BY job_id
ORDER BY date_posted
LIMIT 0,50

然后您可以将连接和最终结构组合在一起以进行更高效的查询。

如果不建议您重新考虑您的限制偏移量，我不能就此放弃。这对于较小的初始偏移量来说很好，但当它开始变大时，这可能是性能问题的主要原因。举个例子，假设你用它来分页，如果他们想要第 3,000 页会发生什么——你将使用

LIMIT 3000, 50

然后这将收集 3050 行/操作数据，然后丢弃前 3000 行。

[编辑 1 - 回应以下评论]

我将扩展更多信息，这些信息可能会为您指明正确的方向。不幸的是，没有一个简单的修复程序可以解决它，您必须了解为什么会发生这种情况才能解决它。简单地删除 LIMIT 或 ORDER BY 可能不起作用，毕竟您不想将 then 作为查询的一部分删除，这意味着它必须出于某种目的而存在。

首先优化简单的基本查询，这通常比使用多连接数据集容易得多。

尽管受到了所有的抨击，filesort 没有任何问题。有时这是执行查询的唯一方法。同意这可能是许多性能问题的原因(尤其是在较大的数据集上)，但这通常不是文件排序的错误，而是底层查询/索引策略的错误。

在 MySQL 中，您不能混合索引或混契约(Contract)一索引的顺序 - 执行此类任务将导致文件排序。

如何按照我的建议在 date_posted 上创建索引然后使用:

SELECT jobs.job_id, jobs.date_posted, jobcats .*, apps.*, company .* FROM
(
    SELECT DISTINCT job_id FROM tabledef_Jobs 
    ORDER BY date_posted
    LIMIT 0,50
) AS jobs
LEFT JOIN tabledef_JobCatLink AS jobcats ON jobs.job_id = jobcats.job_id
LEFT JOIN tabledef_Applications AS apps ON jobs.job_id = apps.job_id
LEFT JOIN tabledef_Companies AS company ON jobs.company_id = company.company_id

关于MySQL:分组/有序/左连接查询非常慢，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/15272838/

29

4

0

文章推荐： java - Java中的垃圾字符删除

文章推荐： UPDATE 查询中的 MySQL IF 语句

文章推荐： ios - ARKit float 飞机

文章推荐： ios - 如何更改 UILabel 中链接的颜色？

mongodb 元组比较(有序)
就类似于这个问题:mongodb query multiple pairs using $in 我想用 (first, last) >= ('John', 'Smith') 找到前 10 个全名。使用
cocoa - 有序 NSDictionary
如何保留向 NSDictionary 添加对象的方式？我意识到 NSDictionary 中的值没有特定的顺序，但就我而言，我需要保留使用 setValue:forKey: 添加的顺序，例如一个数组
assembly - 有序/无序比较是什么意思？
看看上证所运营商 CMPORDPS - ordered compare packed singles CMPUNORDPS - unordered compare packed singles 有序和
java - powermock 有序
我使用 PowerMock 来模拟静态方法。我需要验证静态和非静态方法调用的顺序。可以使用 PowerMock 来做吗？ UPD 我使用 powermockito 扩展来模拟静态方法，因此使用 pow
scala - 合并两个流(有序)以获得最终排序的流
例如，如何合并两个已排序的整数流？我认为这是非常基本的，但只是发现它根本不是微不足道的。下面的不是尾递归的，当流很大时它会堆栈溢出。 def merge(as: Stream[Int], bs: St
c - 用于在二叉树中查找(有序)节点后继的代码中的段错误
我试图在二叉树中查找/打印每个节点的中序后继，但编译器给我的结果是段错误。这是结构:- struct node { int x; struct node *left; str
sql - 使整个 block 有序
我有一个查询看起来像 SELECT a, b, c, d FROM tab ORDER BY a ASC, b ASC 我的结果集看起来像 +-----------------
php - 有序 SQL 时间戳提取
首先，我试过搜索这个主题但一无所获(似乎找不到合适的关键词)，所以如果这是重复的，请告知。我一直在尝试从我的数据库中获取一些 time_stamp 并将它们按时间间隔排序。例如，我运行一个查询，如
c++ - 有序 QVector 中的二进制搜索
这个问题在这里已经有了答案: How do I get the index of an iterator of an std::vector? (9 个回答) 关闭 6 年前。我已经订购了 QVe
java - 有序 Hibernate 列表违反唯一约束
我有以下实体，如果我尝试通过 removeTask 方法从 TaskList 中删除 Task，则会出现异常。 @Entity public class TaskList extends Generi
c - 将字符串中的每个字母(有序)合并为一个新字符串
所以，我对 C 编程还是很陌生。有3个长度相同的字符串。 str1="abc", str2="def", str3="ghi". 新字符串中的输出将类似于“adgbehcfi”。 #include
MySQL:分组/有序/左连接查询非常慢
我的查询有一个问题，它花费的时间太长(仅仅这个简单的查询就超过了两秒)。乍一看，这似乎是一个索引问题，所有连接的字段都已编入索引，但我找不到其他我可能需要编入索引以加快速度的内容。一旦我将我需要的字
java - 有序 map 实现
我正在寻找一个 Map 实现，它按照键值对的添加顺序迭代它们。例如 Map orderedMap = // instantiation omitted for obvious reasons :) o
database - 分层、有序、键值存储？
我正在寻找具有以下功能的数据库系统: 分层(多维)键每个维度的键排序因此，如果我的 key 类似于 App > User > Item，我可以运行如下查询:“该用户的下一项是什么？”或者“这个应用
c++ - 使无序初始化 statc 有序
以下类使用 CRTP 尝试将类型添加到具有 Schwarz 计数器以确保初始化顺序的 std::vector。根据 3.6.2/2 成员 h_ 具有无序初始化。我将如何更改它以确保它已订购初始化？我希
C++有序(稳定)优先级队列
我正在实现一个玩具调度程序，它读取进程规范(例如到达时间、总运行时间)的输入文件，然后根据随机 io/cpu 突发调度进程。文件格式 Arrival time, total CPU time, CP
Python - 有序 header HTTP 请求
我目前正在使用 python 2.7 requests 库，并且不支持有序 header 。我可以为 post 和 get 放置有序数据(如有序字典)，但根本不支持标题。甚至在 python 3 中也
java - java中是否有并发&自过期&有序 HashMap
我正在使用来自 google guava 的 ConcurrentHashMap(通过 MapMaker)，但该实现未排序。google guava 中有 ConcurrentSkipListMap，
java - 有序(自然插入顺序)和线程安全的 Java Map
我有一个旧应用程序，其中使用 ConcurrentHashMap。现在我们知道并发HasMap 是无序的，但是需要读取最初插入的对象。我已经在生产中使用了一段时间的代码，因此我正在寻找快速替代方案来替
c# - 保持 .NET 依赖注入(inject)有序
最近我开始使用 .NET Core 2.1 开发一个新项目，我决定使用 SOLID 原则并创建一个漂亮的项目结构。这是一个 Web API 项目。一切正常我使用了很多依赖注入(inject)，大部分

首页

博学

6Ren·AI

商城

MySQL:分组/有序/左连接查询非常慢