sql - 包含带 OR 条件的分组规则的 GROUP BY 优化-6ren

sql - 包含带 OR 条件的分组规则的 GROUP BY 优化

转载作者：行者123 更新时间：2023-12-01 12:06:44

25

4

有一些表 T1(在 Oracle 数据库中)有一些字段 A、B、C , D, E, F:

Upd 0:让以上字段的类型相同。

假设，我们需要按照以下规则对表进行分组:A & B & (C | D)

更新 1:A & B & (C | D) 表达式可以转换为以下表达式:

(A & B & C) | (A & B & D)。

因此，为了解决这个任务，我必须合并两个分组查询，分别针对组 A、B、C 和 A、B、D:

select A, B, C, count(*) 
from T1 
group by A, B, C

  union all

select A, B, D, count(*) 
from T1 
group by A, B, D

如果分组规则会更复杂:A & B & (C | D) & (E | F)，那么解决方案会更庞大，因为我必须联合分组查询对于以下群体:

A & B & C & E, A & B & D & E, A & B & C & F, >A & B & D & F.

有没有可能优化这样的解决方案？或者是否有更好的方法来解决此类任务？

更新 2:我使用了简短的表达式 A & B & (C | D) 和 A & B & (C | D) & (E | F) 来强调它们有公共(public)部分 A & B。而且我不希望它被计算很多次。

最佳答案

GROUPING SETS子句可以简化代码，提高多个分组组合的性能。

更简单的代码

举个例子，让我们从一个简单的表格开始:

create table t1(a number, b number, c number, d number);
insert into t1
select 0,0,0,0 from dual union all
select 1,0,0,0 from dual union all
select 0,1,0,0 from dual union all
select 1,1,0,0 from dual union all
select 0,0,1,0 from dual union all
select 1,0,1,0 from dual union all
select 0,1,1,0 from dual union all
select 1,1,1,0 from dual union all
select 0,0,0,1 from dual union all
select 1,0,0,1 from dual union all
select 0,1,0,1 from dual union all
select 1,1,0,1 from dual union all
select 0,0,1,1 from dual union all
select 1,0,1,1 from dual union all
select 0,1,1,1 from dual union all
select 1,1,1,1 from dual;

下面的查询表示按“A & (B | C)”分组。 (与您的示例不同，我将包含一些空列来演示分组的工作原理。)

select a, b, null c, count(*)
from t1
group by a, b
union all
select a, null b, c, count(*)
from t1
group by a, c;

A   B   C   COUNT(*)
-   -   -   --------
1   0              4
0   0              4
1   1              4
0   1              4
1      0           4
0      0           4
1      1           4
0      1           4

使用 GROUPING SETS 重写会产生与前面查询相同的结果:

select a, b, c, count(*)
from t1
group by grouping sets((a, b), (a, c));

更好的表现

使用 explain plan for ... 运行上述查询，然后 select * from table(dbms_xplan.display(format => 'basic')); 返回遵循执行计划。

对于 UNION ALL 版本:

------------------------------------
| Id  | Operation           | Name |
------------------------------------
|   0 | SELECT STATEMENT    |      |
|   1 |  UNION-ALL          |      |
|   2 |   HASH GROUP BY     |      |
|   3 |    TABLE ACCESS FULL| T1   |
|   4 |   HASH GROUP BY     |      |
|   5 |    TABLE ACCESS FULL| T1   |
------------------------------------

对于 GROUPING SETS 版本:

-------------------------------------------------------------------------------
| Id  | Operation                                | Name                       |
-------------------------------------------------------------------------------
|   0 | SELECT STATEMENT                         |                            |
|   1 |  TEMP TABLE TRANSFORMATION               |                            |
|   2 |   LOAD AS SELECT (CURSOR DURATION MEMORY)| SYS_TEMP_0FD9D6787_464CF95 |
|   3 |    TABLE ACCESS FULL                     | T1                         |
|   4 |   LOAD AS SELECT (CURSOR DURATION MEMORY)| SYS_TEMP_0FD9D6788_464CF95 |
|   5 |    HASH GROUP BY                         |                            |
|   6 |     TABLE ACCESS FULL                    | SYS_TEMP_0FD9D6787_464CF95 |
|   7 |   LOAD AS SELECT (CURSOR DURATION MEMORY)| SYS_TEMP_0FD9D6788_464CF95 |
|   8 |    HASH GROUP BY                         |                            |
|   9 |     TABLE ACCESS FULL                    | SYS_TEMP_0FD9D6787_464CF95 |
|  10 |   VIEW                                   |                            |
|  11 |    TABLE ACCESS FULL                     | SYS_TEMP_0FD9D6788_464CF95 |
-------------------------------------------------------------------------------

UNION ALL 执行计划为每个不同的分组从源表中读取一次。 GROUPING SETS 执行计划只从源表中读取一次，将信息存储在临时表中，然后从该临时表中读取。

如果查询仅使用行的一小部分或列的一小部分，GROUPING SETS 计划可能会明显更快，因为它只需要读取完整数据一次。

关于sql - 包含带 OR 条件的分组规则的 GROUP BY 优化，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55790724/

25

4

0

文章推荐： php - 无法在我的代码中设置 session.save_handler

文章推荐： java - actionPerformed 和方法等于不与 Controller 一起使用

Linq group by + where for each group
我想编写一个 linq 表达式，该表达式将返回不包含特定值的 ID。例如，我想返回所有不具有 Value = 30 的不同 ID。 ID, Value 1, 10 1, 20 1, 30 2,
正则表达式 : Grouping in a group
我正在尝试使用 Regexp 匹配 Nmap 命令的输出。可以有两种不同的格式。第一种格式(当 nmap 可以找到主机名时) Nmap scan report for 2u4n32t-n4 (192
mysql - "Mixing of GROUP columns .. with no GROUP columns is illegal if there is no GROUP BY clause"
我正在 Visual Studio 2012 上使用 C# 开发一个软件。我使用 MySQL Connector 6.9.1 进行 MySQL 连接。我的软件在我的操作系统(Win8 x64)上运行顺
Django 嵌套组 : Groups in Groups
在 Django 中(使用 django.contrib.auth 时)我可以添加一个 Group到另一个 Group ?即一个Group成为另一个成员(member) Group ? 如果是这样，我
grouping - LOOP AT... GROUP BY 使用动态组键
我试图通过使用动态组参数对数据进行分组来循环。我们可以在循环的 WHERE 条件上使用动态查询，但我不知道是否可以在组条件中使用动态字符串。以下是用户决定按哪个字段分组，然后根据决定放置其他逻辑的
python 正则表达式 : group of groups?
我有这样的字符串 s = 'MR1|L2-S1x' 模式总是相同的:一个或两个字符，在 [|.+:x-] 中可选地后跟一个数字和一个分隔符。此模式可以重复 6 次。所以匹配模式很明确。 p = r'
mysql - 如何在不触发 "Mixing of GROUP columns [...] with no GROUP columns is illegal if there is no GROUP BY clause"的情况下获取最小列值？
我有一个带有时间戳字段“bar”的表“foo”。如何仅获取查询的最旧时间戳，例如: SELECT foo.bar from foo？我尝试执行以下操作: SELECT MIN(foo.bar) fro
python - auth.User.groups : (fields. E304) 'User.groups' 的反向访问器与 'UserManage.groups' 的反向访问器冲突
在我的 Django 项目中，我有一个 user_manage 应用程序。我在 user_manage 应用的 model.py 中创建了一个名为 UserManage 的模型: from djan
xslt-2.0 - 当总体中的某个项目与 "group-by"中的 "for-each-group"不匹配时，是否可以将其分配给具有空 current-group-key() 的组？
所以我有这样的输入: 还有一个模板指令，例如: 看来我只获得了 foo 和 bar 的组。 (为什么？我预计我可能会得到第三组 current-group-key() = '')。
django - user.groups.add(group) 或 group.user_set.add(user)，哪个更好，为什么？或它们之间的区别
我正在尝试扩展 django.contrib.auth 并遇到将用户添加到组中的情况，这可以通过两种方式完成。我只是想知道为什么会这样，以及其中一种相对于另一种的优势是什么。最佳答案他们做完全相同
php - 如果没有 GROUP BY 子句，则将 GROUP 列(MIN()、MAX()、COUNT()、...)与没有 GROUP 列的混合是非法的
我使用的是旧的 PHP 脚本，并且此查询有错误。由于我没有使用 mysql 的经验，因此无法修复它。 "SELECT COUNT(p.postid) AS pid, p.*, t.* FROM ".T
iphone - 将 Group of Persons 添加到 ABAddressBookRef，group added ok，但是 person 没有添加到 Group？
我有几行 Objective-C 代码，例如: ABAddressBookRef addressBook; CFErrorRef error = NULL; addressBook = ABAddre
mysql - 如果没有 GROUP BY 子句，则将 GROUP 列(MIN()、MAX()、COUNT()...)与没有 GROUP 列的混合是非法的。玛丽亚数据库错误
我正在使用 MariaDB IMDB 电影数据集，我试图解决以下问题。电影表包含 id、名称、排名和年份列 A decade is a sequence of 10 consecutive years
sql - 利斯塔格 : group within group
让我从数据开始，以便更好地描述我的需求。我有一个名为 SUPERMARKET 的表，其中包含以下字段: Field 1: StoreID Field 2: ProductCategory Field
group-by - 带有子查询的 DISTINCT 或 GROUP BY
你好我有这个查询: SELECT DISTINCT a.id, a.runcd, (SELECT SUM(b.CALVAL) FROM GRS b WHERE b.PCode=11000 AND a.
group-by - 如何在 Marklogic 中使用 Group By？
我想在 xquery 中使用 Group By。有人可以告诉我如何在 Marklogic 中使用 Group By 吗？最佳答案或者，您可以使用 xdmp:xslt-invoke 调用 XSLT或
group-by - Sequelize group by 与关联包括 id
因此，当通过 from sequelize 请求组时，如下所示: return models.WorkingCalendar .findAll({
SQL SUM Group by - 基于另一个表中的 'group'
我希望我解释正确。我有 2 个表，有第一个表(table1) +------------+------+-------+-------+ | Date | Item | Block |
sql - "HAVING ... GROUP BY"和 "GROUP BY ... HAVING"之间的区别
我的表 MYTABLE 有 2 列:A 和 B 我有以下代码片段: SELECT MYTABLE.A FROM MYTABLE HAVING SUM(MYTABLE.B) > 100
group-by - Mysql 加速 max() group by
我有一个简单的行分组查询，需要 0.0045 秒。 300.000 行从表 GROUP BY cid 中选择 cid 当我添加 MAX() 进行查询时，需要 0.65 秒才能返回。从表 GROUP

首页

博学

6Ren·AI

商城