sql - 如何使用 WITH RECURSIVE 子句进行选择-6ren

sql - 如何使用 WITH RECURSIVE 子句进行选择

转载作者：行者123 更新时间：2023-11-29 11:09:06

关闭。这个问题需要更多focused .它目前不接受答案。

想改善这个问题吗？更新问题，使其仅关注一个问题 editing this post .

7年前关闭。

Improve this question

我用谷歌搜索并阅读了一些文章，例如
this postgreSQL manual page
或 this blog page
并尝试自己进行查询并取得了一定的成功(其中一部分挂起，而其他一些运行良好且快速)，
但到目前为止我还不能完全理解这种魔法是如何工作的。

任何人都可以给出非常清楚的解释来展示这种查询语义和执行过程，
更好地基于典型样本，例如来自 (id,parent_id,name) 的阶乘计算或全树扩展 table ？

以及人们应该知道的基本准则和典型错误是什么with recursive查询？

最佳答案

首先，让我们尝试简化和澄清 manual page 上给出的算法描述。 .为简化起见，仅考虑 union all在 with recursive现在的条款(和 union 以后):

WITH RECURSIVE pseudo-entity-name(column-names) AS (
    Initial-SELECT
UNION ALL
    Recursive-SELECT using pseudo-entity-name
)
Outer-SELECT using pseudo-entity-name

为了澄清它，让我们用伪代码描述查询执行过程:

working-recordset = result of Initial-SELECT

append working-recordset to empty outer-recordset

while( working-recordset is not empty ) begin

    new working-recordset = result of Recursive-SELECT 
        taking previous working-recordset as pseudo-entity-name

    append working-recordset to outer-recordset

end

overall-result = result of Outer-SELECT 
    taking outer-recordset as pseudo-entity-name

或者更短 - 数据库引擎执行初始选择，将其结果行作为工作集。然后对工作集反复执行递归选择，每次都用查询结果替换工作集的内容。当递归选择返回空集时，此过程结束。并且所有由初始选择和递归选择首先给出的结果行被收集并提供给外部选择，该结果成为整体查询结果。

此查询正在计算阶乘共 3 个:

WITH RECURSIVE factorial(F,n) AS (
    SELECT 1 F, 3 n
UNION ALL
    SELECT F*n F, n-1 n from factorial where n>1
)
SELECT F from factorial where n=1

初始选择 SELECT 1 F, 3 n给我们初始值:3 为参数，1 为函数值。
递归选择 SELECT F*n F, n-1 n from factorial where n>1声明每次我们需要将最后一个函数值乘以最后一个参数值并减少参数值。
数据库引擎是这样执行的:

首先它执行initail select，它给出了工作记录集的初始状态:

F | n
--+--
1 | 3

然后它用递归查询转换工作记录集并获得它的第二个状态:

F | n
--+--
3 | 2

然后第三个状态:

F | n
--+--
6 | 1

在第三种状态下，没有跟随 n>1 的行递归选择中的条件，因此工作集是循环退出。

外部记录集现在包含所有行，由初始和递归选择返回:

F | n
--+--
1 | 3
3 | 2
6 | 1

外部选择过滤掉外部记录集中的所有中间结果，只显示最终的阶乘值，它成为整体查询结果:

F 
--
6

现在让我们考虑表 forest(id,parent_id,name) :

id | parent_id | name
---+-----------+-----------------
1  |           | item 1
2  | 1         | subitem 1.1
3  | 1         | subitem 1.2
4  | 1         | subitem 1.3
5  | 3         | subsubitem 1.2.1
6  |           | item 2
7  | 6         | subitem 2.1
8  |           | item 3

' 展开全树 ' 这里的意思是在计算它们的级别和(可能)路径时，以人类可读的深度优先顺序对树项进行排序。在不使用 WITH RECURSIVE 子句(或 Oracle CONNECT BY 子句，PostgreSQL 不支持)的情况下，这两项任务(正确排序和计算级别或路径)都无法在一个(甚至任何恒定数量的)SELECT 中解决。但是这个递归查询可以完成这项工作(好吧，几乎可以，请参阅下面的注释):

WITH RECURSIVE fulltree(id,parent_id,level,name,path) AS (
    SELECT id, parent_id, 1 as level, name, name||'' as path from forest where parent_id is null
UNION ALL
    SELECT t.id, t.parent_id, ft.level+1 as level, t.name, ft.path||' / '||t.name as path
    from forest t, fulltree ft where t.parent_id = ft.id
)
SELECT * from fulltree order by path

数据库引擎是这样执行的:

首先，它执行 initail select，它给出了来自 forest 的所有最高级别的项目(根)。 table :

id | parent_id | level | name             | path
---+-----------+-------+------------------+----------------------------------------
1  |           | 1     | item 1           | item 1
8  |           | 1     | item 3           | item 3
6  |           | 1     | item 2           | item 2

然后，它执行递归选择，给出来自 forest 的所有第 2 级项目。 table :

id | parent_id | level | name             | path
---+-----------+-------+------------------+----------------------------------------
2  | 1         | 2     | subitem 1.1      | item 1 / subitem 1.1
3  | 1         | 2     | subitem 1.2      | item 1 / subitem 1.2
4  | 1         | 2     | subitem 1.3      | item 1 / subitem 1.3
7  | 6         | 2     | subitem 2.1      | item 2 / subitem 2.1

然后，它再次执行递归选择，检索 3d 级别的项目:

id | parent_id | level | name             | path
---+-----------+-------+------------------+----------------------------------------
5  | 3         | 3     | subsubitem 1.2.1 | item 1 / subitem 1.2 / subsubitem 1.2.1

现在它再次执行递归选择，尝试检索第 4 级项目，但没有任何项目，因此循环退出。

外部 SELECT 设置正确的人类可读行顺序，按路径列排序:

id | parent_id | level | name             | path
---+-----------+-------+------------------+----------------------------------------
1  |           | 1     | item 1           | item 1
2  | 1         | 2     | subitem 1.1      | item 1 / subitem 1.1
3  | 1         | 2     | subitem 1.2      | item 1 / subitem 1.2
5  | 3         | 3     | subsubitem 1.2.1 | item 1 / subitem 1.2 / subsubitem 1.2.1
4  | 1         | 2     | subitem 1.3      | item 1 / subitem 1.3
6  |           | 1     | item 2           | item 2
7  | 6         | 2     | subitem 2.1      | item 2 / subitem 2.1
8  |           | 1     | item 3           | item 3

注意 :只有在没有标点字符整理前 / 时，结果行顺序才会保持正确在项目名称中。如果我们重命名 Item 2在 Item 1 * ，它将打破行序，站在 Item 1 之间及其后代。
更稳定的解决方案是使用制表符( E'\t' )作为查询中的路径分隔符(稍后可以用更具可读性的路径分隔符替换:在外部选择中，在向人类等显示之前)。制表符分隔的路径将保持正确的顺序，直到项目名称中有制表符或控制字符 - 可以轻松检查和排除，而不会损失可用性。

修改最后一个查询以扩展任何任意子树非常简单 - 您只需要替换条件 parent_id is null与 perent_id=1 (例如)。请注意，此查询变体将返回与 Item 1 相关的所有级别和路径。 .

现在关于 典型错误 .递归查询最显着的典型错误是在递归选择中定义病态停止条件，这会导致无限循环。

例如，如果我们省略 where n>1条件在上面的阶乘示例中，递归选择的执行永远不会给出空集(因为我们没有条件过滤掉单行)并且循环将无限继续。

这是您的某些查询挂起的最可能原因(另一个非特定但仍然可能的原因是非常无效的选择，它在有限但很长的时间内执行)。

没有太多 RECURSIVE 特定的查询指南顺便提一下，据我所知。但我想建议(相当明显)逐步递归查询构建过程。

单独构建和调试您的初始选择。

用带有递归结构的脚手架包裹它
并开始构建和调试您的递归选择。

推荐的脚手架结构是这样的:

WITH RECURSIVE rec( <Your column names> ) AS (
    <Your ready and working initial SELECT>
UNION ALL
    <Recursive SELECT that you are debugging now>
)
SELECT * from rec limit 1000

这个最简单的外部选择将输出整个外部记录集，正如我们所知，它包含来自初始选择的所有输出行和循环中的每次递归选择的执行，它们的原始输出顺序 - 就像上面的示例一样! limit 1000部分将防止悬挂，用超大输出替换它，您将能够看到错过的停止点。

在调试初始和递归选择构建并调试外部选择之后。

现在要提到的最后一件事 - 使用 的区别union 而不是 union all在 with recursive条款。它引入了行唯一性约束，导致在我们的执行伪代码中多出两行:

working-recordset = result of Initial-SELECT

discard duplicate rows from working-recordset /*union-specific*/

append working-recordset to empty outer-recordset

while( working-recordset is not empty ) begin

    new working-recordset = result of Recursive-SELECT 
        taking previous working-recordset as pseudo-entity-name

    discard duplicate rows and rows that have duplicates in outer-recordset 
        from working-recordset /*union-specific*/

    append working-recordset to outer-recordset

end

overall-result = result of Outer-SELECT 
    taking outer-recordset as pseudo-entity-name

关于sql - 如何使用 WITH RECURSIVE 子句进行选择，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/18659992/

文章推荐： html - 在 iOS 上的 Quicktime 中启动嵌入的 YouTube 视频

文章推荐： ios - 使用 OSX 在 virtualbox 上运行 xcode

文章推荐： ruby-on-rails - PG::ConnectionBad FATAL:角色 "Myname"不存在

sql-server - 非聚集索引上的 Where 子句 Vs 额外连接和聚集索引上的 where 子句
我试图从一些 sql 查询中获得一些额外的性能，这些查询在一个字段上有一个 where 子句，它是一个非唯一的非聚集索引，它也是表 A 中的一个外键。该外键是主键在表 B 上，是聚集索引。我想知道的
batch-file - 结合 For/F 与 WMIC + WHERE 子句 + AND 子句
当包含在 FOR 中时，应该如何编写此 WMIC 命令脚本中的命令？ wmic service where (name="themes" and state="running") get 下面的代码不
TSQL:over 子句
请帮我理解如何订购对over子句的影响。我已经阅读了 msdn 和一本书，但仍然误解了。假设我们有这样的查询: SELECT Count(OrderID) over(Partition By Ye
SQL:HAVING 子句
参见如下SQL语句: SELECT datediff("d", MAX(invoice.date), Now) As Date_Diff , MAX(invoice.date) AS ma
CodeigniterWhere 子句
不知何故，对我来说构建这样的查询有点困难:给我所有链接名称不为空的导航条目 $query = $this->db->get_where('navigation',array('linkname'!==
SQL ALL IN 子句
我一直在寻找这个，但没有发现任何特别的东西。是否可以有一个像 ALL IN 一样的 SQL 查询？为了更好地解释，这是一个表结构。 Orders table OrderItem table (hav
SQL:Where 子句
SELECT DISTINCT Campaign_id FROM Impressions WHERE Date BETWEEN '2015-03-01' AND '2015-03-31' ; 上述查询
MyBatis if 子句
我尝试在 MyBatis 中遵循 if 子句并得到以下异常请帮助我确定这里的问题.. public class Student{ private Integer studId; private Str
sql - & IN WHERE 子句
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开，visit the help center . 关闭 1
MyBatis if 子句
我尝试在 MyBatis 中遵循 if 子句并得到以下异常请帮助我确定这里的问题.. public class Student{ private Integer studId; private Str
mySQL where in 子句
是否可以用 where in 子句做这样的事情，我需要使用 where in 查询以下数据。 select * FROM instructor AS i INNER JOIN teaches AS t
mysql - IF on WHERE 子句
嗨，我怎样才能让这个查询工作。我想要一个关于 where 子句的条件，如果 @BACHNUMB = ''，那么 WHERE 是 (h.sopnumbe = @SOPNUMBE) 否则 WHERE 是
c# - WHERE IN 子句
我在 MVC3 项目中工作。我浏览了一段时间并尝试了几个示例，但无法正常工作。我需要从 OrderForm 表中获取记录列表，其 DeptID 在我已经获得的另一个列表中。我知道我需要使用 Con
Mysql where 子句
select * from staff LEFT JOIN servicereservation on servicereservation.snic = staff.snic where servi
MySQL "WITH"子句
我正在尝试使用 MySQL 创建带有“WITH”子句的 View WITH authorRating(aname, rating) AS SELECT aname, AVG(quantity)
MySQL When 子句
我正在尝试使用 MySQL 创建触发器，但遇到错误。限制是:用户不得对他或她同时销售的商品出价。 Create Trigger before_insert_bid Before Insert on B
PostgreSQL WHERE IN 子句
我正在尝试在 PostgreSql 的 WHERE IN 子句中使用 split_part，如下所示。这里 Objcode 是 small int 类型，objection 可能像 1374,824,
mysql if in where 子句
这可能很简单，只是我太厚了 - 我试图阻止保留的元素在记录中被拾取，但只有当库存大于 0 时，我不知道该怎么做除非 "....WHERE blah blah AND (reserved = 0 OR
MySQL if then 子句
我总结了两个表中两列的行，即如下所示: SUM( tableA.age ) + sum( tableB.age) as 'Total Ages' 但在某些情况下，A表的结果为空，而B表的结果则不是。在
mysql AS 子句
我写了一个查询，从出生日期字段开始计算出一个人的年龄，然后使用 AS age 创建一个年龄字段。我的问题是，是否可以再次匹配那个年龄字段？像这样， SELECT `candidates`.`can

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

sql - 如何使用 WITH RECURSIVE 子句进行选择