mysql - 使用 Case 查询更有效的分组依据-6ren

mysql - 使用 Case 查询更有效的分组依据

转载作者：行者123 更新时间：2023-11-29 06:54:23

25

4

我有以下查询构建一个记录集，该记录集在饼图中用作报告。

它不是经常运行，但是当它运行时需要几秒钟，我想知道是否有任何方法可以提高它的效率。

SELECT
  CASE
    WHEN (lastStatus IS NULL)     THEN 'Unused'
    WHEN (attempts > 3 AND callbackAfter IS NULL)   THEN 'Max Attempts Reached'
    WHEN (callbackAfter IS NOT NULL AND callbackAfter >  DATE_ADD(NOW(), INTERVAL 7 DAY)) THEN 'Call Back After 7 Days'
    WHEN (callbackAfter IS NOT NULL AND callbackAfter <= DATE_ADD(NOW(), INTERVAL 7 DAY)) THEN 'Call Back Within 7 Days'
    WHEN (archived = 0)     THEN 'Call Back Within 7 Days'
    ELSE 'Spoke To'
  END AS statusSummary,
  COUNT(leadId) AS total
FROM
  CO_Lead
WHERE
  groupId = 123
  AND
  deleted = 0
GROUP BY
  statusSummary
ORDER BY
  total DESC;

我有一个 (groupId, deleted) 的索引，但我不确定将任何其他字段添加到索引中是否有帮助(如果可以，我如何决定哪个应该先走？callbackAfter 因为它用得最多？)

该表大约有 500,000 行(但从现在起一年内会增加 10 倍。)

我唯一能想到的另一件事是将它分成 6 个查询(将 WHEN 子句移到 WHERE 中)，但这会使它花费 3 倍的时间。

编辑:

这是表定义

CREATE TABLE CO_Lead (
  objectId                             int UNSIGNED       NOT NULL AUTO_INCREMENT,
  groupId                              int UNSIGNED       NOT NULL,
  numberToCall                         varchar(20)        NOT NULL,
  firstName                            varchar(100)       NOT NULL,
  lastName                             varchar(100)       NOT NULL,
  attempts                             tinyint            NOT NULL default 0,
  callbackAfter                        datetime           NULL,
  lastStatus                           varchar(30)        NULL,
  createdDate                          datetime           NOT NULL,
  archived                             bool               NOT NULL default 0,
  deleted                              bool               NOT NULL default 0,
  PRIMARY KEY (
    objectId
  )
) ENGINE = InnoDB;
ALTER TABLE CO_Lead ADD CONSTRAINT UQIX_CO_Lead UNIQUE INDEX (
  objectId
);
ALTER TABLE CO_Lead ADD INDEX (
  groupId,
  archived,
  deleted,
  callbackAfter,
  attempts
);
ALTER TABLE CO_Lead ADD INDEX (
  groupId,
  deleted,
  createdDate,
  lastStatus
);
ALTER TABLE CO_Lead ADD INDEX (
  firstName
);
ALTER TABLE CO_Lead ADD INDEX (
  lastName
);
ALTER TABLE CO_Lead ADD INDEX (
  lastStatus
);
ALTER TABLE CO_Lead ADD INDEX (
  createdDate
);

最佳答案

注意事项:

如果 leadId 不能为 NULL，则将 COUNT(leadId) 更改为 COUNT(*)。它们在逻辑上是等价的，但大多数版本的 MySQL 优化器都没有那么聪明地识别这一点。
删除两个冗余的 callbackAfter IS NOT NULL 条件。如果 callbackAfter 满足第二部分，则无论如何都不能为 null。
将查询分成 6 个部分并为每个部分添加适当的索引可能会受益 - 但根据 CASE 中的条件是否重叠，您可能会得到错误或正确的结果。

可能的重写(注意不同的格式并检查这是否返回相同的结果，它可能不会!)

SELECT
    cnt1 AS "Unused"
  , cnt2 AS "Max Attempts Reached"
  , cnt3 AS "Call Back After 7 Days"
  , cnt4 AS "Call Back Within 7 Days"
  , cnt5 AS "Call Back Within 7 Days"
  , cnt6 - (cnt1+cnt2+cnt3+cnt4+cnt5) AS "Spoke To"
FROM
  ( SELECT
      ( SELECT COUNT(*)  FROM CO_Lead
        WHERE groupId = 123 AND deleted = 0
          AND lastStatus IS NULL
      ) AS cnt1
    , ( SELECT COUNT(*)  FROM CO_Lead
        WHERE groupId = 123 AND deleted = 0
          AND attempts > 3 AND callbackAfter IS NULL
      ) AS cnt2
    , ( SELECT COUNT(*)  FROM CO_Lead
        WHERE groupId = 123 AND deleted = 0
          AND callbackAfter >  DATE_ADD(NOW(), INTERVAL 7 DAY)
      ) AS cnt3
    , ( SELECT COUNT(*)  FROM CO_Lead
        WHERE groupId = 123 AND deleted = 0
          AND callbackAfter <= DATE_ADD(NOW(), INTERVAL 7 DAY)
      ) AS cnt4
    , ( SELECT COUNT(*)  FROM CO_Lead
        WHERE groupId = 123 AND deleted = 0
          AND archived = 0
      ) AS cnt5
    , ( SELECT COUNT(*)  FROM CO_Lead
        WHERE groupId = 123 AND deleted = 0
      ) AS cnt6
  ) AS tmp ;

如果它确实返回了正确的结果，您可以添加用于每个子查询的索引:

对于子查询 1:(groupId, deleted, lastStatus)

对于子查询 2、3、4:(groupId, deleted, callbackAfter, attempts)

对于子查询 5:(groupId, deleted, archived)

另一种方法是保留您的查询(仅注意上面的注释 1 和 2)并添加一个广泛的覆盖索引:

 (groupId, deleted, lastStatus, callbackAfter, attempts, archived)

关于mysql - 使用 Case 查询更有效的分组依据，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/13634244/

25

4

0

文章推荐： mysql - 多个处理程序冲突

文章推荐： java - 如何引用既扩展又实现的实例？

文章推荐： java - 斐波那契数列 long[] 数组在索引 92 后抛出负数

文章推荐： java - 如何将新的依赖项插入 Gradle 项目？

mysql - 按 parent 分组，但不按 child 分组
您好，我正在处理 BIRT 报告。我有一个查询，我必须对父级的重复数据进行分组，但子级也不能分组! 在我的查询中: item 是父项，item_ledger_entry 是子项。我有来自 item.N
google-analytics - 为什么 MCF channel 分组≠默认 channel 分组？
我正在使用 GA API。这是针对 MCF 目标报告(底部)的标准目标完成指标表(顶部) 看一下这个: 总数加起来 (12,238)，但看看按 channel 分组的分割有多么不同!我以为这些会很接
OrientDB 分组
我正在开发一个流量计数器，我想获得 IP 和重复计数，但是如何？就像是 :select ip, count(ip) from Redirect 返回 : null total ip count 重定
Java正则表达式(分组)
我尝试编写一个正则表达式来匹配条件表达式，例如: a!=2 1+2=2+a 我尝试提取运算符。我当前的正则表达式是“.+([!=<>]+).+” 但问题是匹配器总是尝试匹配组中可能的最短字符串
分组、平均的SQL子查询问题
在 MS Transact SQL 中，假设我有一个这样的表(订单): Order Date Order Total Customer # 09/30/2008 8
MySQL:分组
我想按 m.ID 分组，并对每个 m.id 求和 (pm.amount_construction* prod.anzahl) 实际上我有以下结果: Meterial_id | amount_const
PostgreSQL 分组
我想根据多列中的值对值进行分组。这是一个例子: 我想得到输出: {{-30,-50,20},{-20,30,60},{-30,NULL or other value, 20}} 我设法到达: SELE
MySql 分组
我正在尝试找出运行此查询的最佳方式。我基本上需要返回在我们的系统中只下了一个订单的客户的“登录”字段列表(登录字段基本上是客户 ID/ key )。我们系统的一些背景...... 客户在同一日期下的
MYSQL - 分组
给定以下mysql结果集: id code name importance '1234', 'ID-CS-B', 'Chocolate Sauce'
python - 分组
大家好，我的数据框中有以下列: LC_REF 1 DT 16 2C 2 DT 16 2C 3 DT 16 2C 1 DT 16 3C 6 DT 16 3C 3
MongoDB 分组
我有这样的 mongoDB 集合 { "_id" : "EkKTRrpH4FY9AuRLj", "stage" : 10, }, { "_id" : "EkKTRrpH4FY9
Python 分组
假设我有一组数据对，其中 index 0 是值，index 1 是类型: input = [ ('11013331', 'KAT'), ('9085267',
java中用stream进行去重，排序，分组
java中用stream进行去重，排序，分组一、distinct 1. 八大基本数据类型 List collect = ListUtil.of(1, 2, 3, 1, 2).stream().fil
SQL - 如何添加具有平均值的列，分组
基本上，我从 TABLE_A 中的这个开始 France - 100 France - 200 France - 300 Mexico - 50 Mexico - 50 Mexico - 56 Pol
正则表达式，分组，查找最后一个匹配项
我希望这个正则表达式 ([A-Z]+)$ 将选择此示例中的最后一次出现: AB.012.00.022ABC-1 AB.013.00.022AB-1 AB.014.00.022ABAB-1 但我没有匹配
数据透视表中的 SQL 分组
我创建了一个数据透视表，但数据没有组合在一起。任何人都可以帮助我获得所需的格式吗？我为获取数据透视表而编写的查询: DECLARE @cols AS NVARCHAR(MAX), -- f
SQL选择并按一段时间(时间戳)分组
我想按时间段(月，周，日，小时，...)选择计数和分组。例如，我想选择行数并将它们按 24 小时分组。我的表创建如下。日期是时间戳。 CREATE TABLE MSG ( MSG_ID dec
围绕间隙的 SQL 分组
在 SQL Server 2005 中，我有一个包含如下数据的表: WTN------------Date 555-111-1212 2009-01-01 555-111-1212 2009-
python - 按多列对数据框中的连续条目进行聚类/分组
题假设我有 k 个标量列，如果它们沿着每列彼此在一定距离内，我想对它们进行分组。假设简单 k 是 2 并且它们是我唯一的列。 pd.DataFrame(list(zip(sorted(choice
pandas - 分组、拆分和选取数据框中的顶行
问题在以下数据框中 df : import random import pandas as pd random.seed(999) sz = 50 qty = {'one': 1, 'two': 2

首页

博学

6Ren·AI

商城

mysql - 使用 Case 查询更有效的分组依据