tsql - T-SQL-连接多个表导致重复的行-6ren

tsql - T-SQL-连接多个表导致重复的行

转载作者：行者123 更新时间：2023-12-04 13:36:31

25

4

我正在努力从下面的示例Fiddle中获得以下结果。

结果:

源表:

Fiddle

这个想法是通过查找预算和预测ID的最大数量来创建每个列，从而为每个RecordID创建一行，以创建其他列(如果该预算或预测ID的值不存在，则将列单元格留空)。

我尝试了PIVOT函数，但甚至无法获得令人满意的结果。

UPDATE :
请参见下图，我试图解释预期的输出:

用词:属于记录ID的每个预算ID的分别为 BDate ，结果(百分比*状态记录的BAmount表)和创建单独的列。

在我的示例中，RecordID 55 在“预算”表中有两个条目-因此，需要 2x3 列才能在此RecordID的单行的自己列中显示每个日期，结果和状态。

由于RecordID 77 在“预算”表中具有大多数(三个)条目，因此可用于在所有行上创建3x3列。

预测也是如此。

我希望你能帮助我。

谢谢你。

最佳答案

再会，

Note! My goal is to help the reader to learn and not to provide final query as a solution for his homework. Therefore I will present the solution in two steps, and I will add several "PRINT" command in the dynamic solution, so the reader will have option to check the intermediate step in the work.

OP提供的DDL + DML:

DROP TABLE IF EXISTS Budget; CREATE TABLE Budget (BudgetID int, RecordID int, BDate date,Percentage int, [Status] varchar(50)); INSERT INTO Budget (BudgetID, RecordID, BDate,Percentage,Status) VALUES (1, 55, '2017-01-01', 60, 'ordered'), (2, 55, '2017-03-24', 40, 'ordered'), (3, 66, '2018-08-15', 100, 'invoiced'), (4, 77, '2018-12-02', 25, 'paid'), (5, 77, '2018-09-10', 35, 'ordered'), (6, 77, '2019-07-13', 40, 'ordered') GO DROP TABLE IF EXISTS Forecast; CREATE TABLE Forecast (ForecastID int, RecordID int, FDate date, Percentage int); INSERT INTO Forecast (ForecastID, RecordID, FDate,Percentage) VALUES (1, 55, '2020-12-01', 100), (2, 77, '2023-05-17', 25), (3, 77, '2024-11-28', 75) GO DROP TABLE IF EXISTS Records; CREATE TABLE Records (RecordID int, BAmount int, FAmount int, Name varchar(40), Description varchar(40) ) ; INSERT INTO Records (RecordID, BAmount,FAmount,Name, Description) VALUES (55, 15000, 33000, 'Prod1', 'Desc1' ), (66, 22000, 17500, 'Prod2', 'Desc2' ), (77, 40000, 44000, 'Prod3', 'Desc3' ) GO select * from Budget select * from Forecast select * from Records

让我们首先展示一个简单的静态解决方案

这是基于以下知识:预算表中的每个RecordID最多具有三行，而预测表中的每个RecordID最多具有两行。这将有助于理解我接下来将展示的动态解决方案

;With CteBudget as ( select b.BDate, b.BudgetID, b.Percentage, b.RecordID, b.Status ,RN = ROW_NUMBER() OVER (partition by b.RecordID order by b.BudgetID) from Budget b ), CteForecast as ( select f.FDate, f.ForecastID, f.Percentage, f.RecordID ,RN = ROW_NUMBER() OVER (partition by f.RecordID order by f.ForecastID) from Forecast f ) select r.RecordID, r.Name, r.Description, b1.BDate BDate1, (b1.Percentage * r.BAmount)/100 BResult1, b1.Status BStatus1, b2.BDate BDate2, (b2.Percentage * r.BAmount)/100 BResult2, b2.Status BStatus2, b3.BDate BDate3, (b3.Percentage * r.BAmount)/100 BResult3, b3.Status BStatus3, f1.FDate FDate1, (f1.Percentage * r.BAmount)/100 FResult1, f2.FDate FDate2, (f2.Percentage * r.BAmount)/100 FResult2 from Records r left join CteBudget b1 on r.RecordID = b1.RecordID and b1.RN = 1 left join CteBudget b2 on r.RecordID = b2.RecordID and b2.RN = 2 left join CteBudget b3 on r.RecordID = b3.RecordID and b3.RN = 3 left join CteForecast f1 on r.RecordID = f1.RecordID and f1.RN = 1 left join CteForecast f2 on r.RecordID = f2.RecordID and f2.RN = 2 --where r.RecordID = 77 GO

Note! For static solution and without indexes (as I will add in the end), the above solution is VERY bad regarding performance, but once we add the right index and as a base for a dynamic solution this option should fit well.

现在我们可以提出动态解决方案。

-- Get number of columns Declare @NumBudget tinyint Declare @NumForecast tinyint SELECT @NumBudget = MAX(C) FROM ( select COUNT(RecordID) C from Budget GROUP BY RecordID ) t SELECT @NumForecast = MAX(C) FROM ( select COUNT(RecordID) C from Forecast GROUP BY RecordID ) t --------------------------------------------- DECLARE @SQLString1 nvarchar(MAX) = ''; DECLARE @SQLString2 nvarchar(MAX) = ''; DECLARE @loop int = 1; WHILE @loop <= @NumBudget BEGIN SET @SQLString1 = @SQLString1 + N' b' + CONVERT(VARCHAR(2),@loop) + '.BDate BDate' + CONVERT(VARCHAR(2),@loop) + ', (b' + CONVERT(VARCHAR(2),@loop) + '.Percentage * r.BAmount)/100 BResult' + CONVERT(VARCHAR(2),@loop) + ', b' + CONVERT(VARCHAR(2),@loop) + '.Status BStatus' + CONVERT(VARCHAR(2),@loop) + ', ' SET @SQLString2 = @SQLString2 + N' left join CteBudget b' + CONVERT(VARCHAR(2),@loop) + ' on r.RecordID = b' + CONVERT(VARCHAR(2),@loop) + '.RecordID and b' + CONVERT(VARCHAR(2),@loop) + '.RN = 1' SET @loop = @loop + 1 END SET @loop = 1 WHILE @loop <= @NumForecast BEGIN SET @SQLString1 = @SQLString1 + N' f' + CONVERT(VARCHAR(2),@loop) + '.FDate FDate' + CONVERT(VARCHAR(2),@loop) + ', (f' + CONVERT(VARCHAR(2),@loop) + '.Percentage * r.BAmount)/100 FResult' + CONVERT(VARCHAR(2),@loop) + ',' SET @SQLString2 = @SQLString2 + N' left join CteForecast f' + CONVERT(VARCHAR(2),@loop) + ' on r.RecordID = f' + CONVERT(VARCHAR(2),@loop) + '.RecordID and f' + CONVERT(VARCHAR(2),@loop) + '.RN = 1' SET @loop = @loop + 1 END SET @SQLString1 = STUFF (@SQLString1, LEN(@SQLString1) , 1 , '') PRINT '/************************************************/' PRINT @SQLString1 PRINT @SQLString2 PRINT '/************************************************/' DECLARE @SQLString nvarchar(MAX); SET @SQLString = N' ;With CteBudget as ( select b.BDate, b.BudgetID, b.Percentage, b.RecordID, b.Status ,RN = ROW_NUMBER() OVER (partition by b.RecordID order by b.BudgetID) from Budget b ), CteForecast as ( select f.FDate, f.ForecastID, f.Percentage, f.RecordID ,RN = ROW_NUMBER() OVER (partition by f.RecordID order by f.ForecastID) from Forecast f ) select r.RecordID, r.Name, r.Description, ' + @SQLString1 + N' from Records r' + @SQLString2 print @SQLString EXECUTE sp_executesql @SQLString GO

IMPORTANT! This solution is not necessarily the one that gives the best performance, but the one that is probably the simplest to follow and understand. On production once we will have the real DDL+DML and the server will have the statistics, then we will be able to improve the performance and chose best solution for our specific case.

指标

Note! The above solution might lead to a lot of sorting of the data, and having the right indexes is HIGHLY important here! It is important to test several different options and select the best.

为了论坛(或任何您称为stackoverflow的原因，我认为这不是讨论论坛界面而是Q＆A界面)，我添加了查询以创建假定在生产中使用的CLUSTERED INDEX，以及一个可选的NONCLUSTERED INDEX您应该进行测试(我没有测试其他选项，这意味着我想到了第一个选项，因此建议您使用真实的DDL + DML继续检查正确的索引)。

-- CLUSTERED INDEX CREATE CLUSTERED INDEX IX_Budget_BudgetID ON dbo.Budget (BudgetID); GO CREATE CLUSTERED INDEX IX_Forecast_ForecastID ON dbo.Forecast (ForecastID); GO CREATE CLUSTERED INDEX IX_Records_RecordID ON dbo.Records (RecordID); GO -- NONCLUSTERED INDEX CREATE NONCLUSTERED INDEX NX_Budget_RecordID_BudgetID ON dbo.Budget (RecordID,BudgetID); GO CREATE NONCLUSTERED INDEX NX_Forecast_RecordID_ForecastID ON dbo.Forecast (RecordID,ForecastID); GO CREATE NONCLUSTERED INDEX NX_Records_RecordID_RecordID ON dbo.Records (RecordID); GO

关于tsql - T-SQL-连接多个表导致重复的行，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/51174706/

25

4

0

文章推荐： kubernetes - 来自服务器的错误( Not Acceptable ): unknown

文章推荐： python - discord.py "wait_for"命令中的 react

文章推荐： java - Visual Studio代码-Java- Lombok -该类型的方法未定义

linux - 我的文件中有 10 行。现在我需要打印前 3 行，然后打印第 5-7 行，然后打印第 9-10 行。 LINUX 的命令是什么？
猫f1.txt阿曼维沙尔阿杰贾伊维杰拉胡尔曼尼什肖比特批评塔夫林现在输出应该符合上面给定的条件最佳答案您可以在文件读取循环中设置一个计数器并打印它，计数=0 读取行时做让我们数一数++ if
python - 查找2个文件中的公共(public)行，从文件1写入公共(public)行，从文件2写入非公共(public)行
我正在尝试查找文件 1 和文件 2 中的共同行。如果公共(public)行存在，我想写入文件 2 中的行，否则打印文件 1 中的非公共(public)行。fin1 和 fin2 是这里的文件句柄。它读
mysql - 从第一个表中选择 1 行，然后从其他表中选择 n 行，然后返回到第一个表并选择第 2 行，依此类推
我有这个 SQL 脚本: CREATE TABLE `table_1` ( `IDTable_1` int(11) NOT NULL, PRIMARY KEY (`IDTable_1`) );
sql - 哪个最快，1x 插入 512 行，4x 插入 128 行，或 512x 插入 1 行
我有 512 行要插入到数据库中。我想知道提交多个插入内容是否比提交一个大插入内容有任何优势。例如 1x 512 行插入 -- INSERT INTO mydb.mytable (id, phonen
Mysql 选择子(行，行 - 1)
如何从用户中选择user_id，SUB(row, row - 1)，其中user_id=@userid我的表用户，id 为 1、3、4、10、11、23...(不是++) --id---------u
mysql - 1M 行，1 个表，几列与 300 个表，3000 行，几列与 300 列，3000 行，1 个表？
我曾尝试四处寻找解决此问题的最佳方法，但我找不到此类问题的任何先前示例。我正在构建一个基于超本地化的互联网购物中心，该区域分为大约 3000 个区域。每个区域包含大约 300 个项目。它们是相似的项
php - 我在第 32 行、第 34 行、第 36 行、第 38 行有错误 :Notice: Undefined offset: 1 in C:\wamp\www\index. php
preg_match('|phpVersion = (.*)\n|',$wampConfFileContents,$result); $phpVersion = str_replace('"','',
正则表达式 - 如何删除前 10 行/和最后 10 行
我正在尝试创建一个正则表达式，使用“搜索并替换全部”删除 200 个 txt 文件的第一行和最后 10 行我尝试 (\s*^(\h*\S.*)){10} 删除包含的前 10 行空白，但效果不佳。最
java - 结果集返回 3 行，但我只能打印 2 行？
下面的代码从数据库中获取我需要的信息，但没有打印出所有信息。首先，我知道它从表中获取了所有正确的信息，因为我已经在 sql Developer 中尝试过查询。 public static void m
sql - 选择前 10 行，然后随机选择其中 5 行
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它，visit the help center 。已关
c# - 数据库操作预计影响 1 行，但实际影响 0 行
我试图在两个表中插入记录，但出现异常。您能帮我解决这个问题吗？首先我尝试了下面的代码。 await _testRepository.InsertAsync(test); await _xyzRepo
css - 在桌面上显示 1 行，在移动设备上显示 2 行
这个基本的 bootstrap CSS 显示 1 行 4 列: Text Text Text
mysql - 从表中选择前 X 行，忽略前 Y 行
如果我想从表中检索前 10 行，我将使用以下代码: SELECT * FROM Persons LIMIT 10 我想知道的是如何检索前 10 个结果之后的 10 个结果。如果我在下面执行这段代码，
java - 为什么 [列,行] 而不是 [行,列]
今天我开始使用 JexcelApi 并遇到了这个:当您尝试从特定位置获取元素时，不是像您通常期望的那样使用sheet.getCell(row,col)，而是使用sheet.getCell(col,ro
PHP - 显示表中最后 3 行 SQL 行(不起作用)
我正在尝试在我的网站上开发一个用户个人资料系统，其中包含用户之前发布的 3 个帖子。我可以让它选择前 3 条记录，但它只会显示其中一条。我是不是因为凌晨 2 点就想编码而变得愚蠢？ query($q)
php - MySQL 组相同的标题(行)并求和金钱(行)，但保留单独的时间戳进行排序
我在互联网上寻找答案，但找不到任何答案。 (我可能问错了？)我有一个看起来像这样的表: 我一直在使用查询: SELECT title, date, SUM(money) FROM payments W
mysql - 获取 100 行，每组最多 10 行
我有以下查询，我想从数据库中获取 100 个项目，但 host_id 多次出现在 urls 表中，我想每个 host_id 从该表中最多获取 10 个唯一行。 select * from urls j
sql - 如何查询前 10 行，下一次从表中查询其他 10 行
我的数据库表中有超过 500 行具有特定日期。查询特定日期的行。 select * from msgtable where cdate='18/07/2012' 这将返回 500 行。如何逐行查询
bash - 打印 n 行，然后在大文本文件中跳过 n 行
我想使用 sed 从某一行开始打印 n 行、跳过 n 行、打印 n 行等，直到文本文件结束。例如在第 4 行声明，打印 5-9，跳过 10-14，打印 15-19 等来自文件 1 2 3 4 5 6
php - 验证密码返回 0 行，而预期返回 1 行
我目前正在执行验证过程来检查用户的旧密码，但问题是我无法理解为什么我的查询返回零行，而预期它有 1 行。另一件事是，即使我不将密码文本转换为 md5，哈希密码仍然得到正确的答案，但我不知道为什么会发生

首页

博学

6Ren·AI

商城

tsql - T-SQL-连接多个表导致重复的行