gpt4 book ai didi

巧妙利用PARTITION分组排名递增特性解决合并连续相同数据行

转载 作者:qq735679552 更新时间:2022-09-29 22:32:09 24 4
gpt4 key购买 nike

CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章巧妙利用PARTITION分组排名递增特性解决合并连续相同数据行由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.

问题提出 。

先造一些测试数据以说明题目:

?
1
2
3
4
5
6
7
8
9
10
DECLARE @TestData TABLE (ID INT ,Col1 VARCHAR (20),Col2 VARCHAR (20))
INSERT INTO @TestData(ID,Col1,Col2)
SELECT 1, 'New' , 'Approved' UNION ALL
SELECT 2, 'Approved' , 'Commited' UNION ALL
SELECT 3, 'Commited' , 'In Progress' UNION ALL
SELECT 4, 'New' , 'Approved' UNION ALL
SELECT 5, 'New' , 'Approved' UNION ALL
SELECT 6, 'New' , 'Approved' UNION ALL
SELECT 7, 'Approved' , 'Removed'
SELECT * FROM @TestData

巧妙利用PARTITION分组排名递增特性解决合并连续相同数据行

巧妙利用PARTITION分组排名递增特性解决合并连续相同数据行

数据说明,ID列连续自增,列1和列2都是TFS中PBI的状态记录,就是从什么变更到什么,如新建到批准,批准到提交神马的 。

现在要求连续且相同的状态变更记录合并,不连续或者不同的状态变更保留,例如:

以上图为例,ID为1,4,5,6的记录都是从New到Approved状态,但是记录1与记录4、5、6不相邻,或者说不连续,那么就要分成两组, 。

记录1一组,记录4、5、6一组,其它记录因为状态变更不相同所以全部保留,最后的查询结果应该长成下图这个样子:

巧妙利用PARTITION分组排名递增特性解决合并连续相同数据行

继续之前你可以先自己试下,这可能会带来新的解题思路, 。

解题思路 。

该问题的关键在于GROUP BY会把记录1、4、5、6合并在一起,而这不符合要求,仅需要合并4、5、6,源表里没有这样一个字段可以将记录1与记录4、5、6区分开来,这是解题的关键 。

这里可以利用RANK函数配合使用PARTITION关键字,首先把1456分到一组去,同时产生一个组内排名的新字段R,这个排名R很关键,后边会用到,见下图:

巧妙利用PARTITION分组排名递增特性解决合并连续相同数据行

RANK函数不了解的点这里 。

RANK函数以Col1 + Col2为分组条件,这样分成了四组,分别是New-Approved、Approved-Commited、Commited-In Progress、Approved-Removed 。

在New-Approved组内,记录1、4、5、6分别排名1、2、3、4;其它组内仅一条记录,在其组内排名均为1 。

现在制造了一个R字段,R字段标识了每条记录在其组内的排名,排名自1开始递增, 。

源表内ID自增,组内排名R递增,这就是解题的关键, 。

当连续相同的记录出现时,其ID与其排名R在同时递增,则其差值是相同的,拿到这个差值就可以很容易解决题目了,看下图:

巧妙利用PARTITION分组排名递增特性解决合并连续相同数据行

记录4、5、6相同且连续出现,其ID与其排名在同时增长,其差值则保持不变,这里使用Col1 + Col2 + Gap作为分组条件即可将记录4、5、6合并,再取个最小ID出来,问题解决,完整脚本如下:

巧妙利用PARTITION分组排名递增特性解决合并连续相同数据行

可是如果ID不连续时怎么办呢?这个不难,参考[MSSQL]ROW_NUMBER函数 。

最后此篇关于巧妙利用PARTITION分组排名递增特性解决合并连续相同数据行的文章就讲到这里了,如果你想了解更多关于巧妙利用PARTITION分组排名递增特性解决合并连续相同数据行的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com