gpt4 book ai didi

sql - 用选择概率优化 T-SQL 查询

转载 作者:行者123 更新时间:2023-12-04 13:52:01 25 4
gpt4 key购买 nike

我有一个条目的表,应该从中选择两个条目。某些条目被选中的概率应该高于其他条目的概率。
目前我用 UNION ALL 解决了这个问题因此,我选择一次所有条目,然后再次选择应该具有更高概率的条目。从这个合并的表中我选择然后在调用 ORDER BY NEWID() 之后用于与 TOP 2 混合两个条目。

SELECT TOP 2 EMail 
FROM (
SELECT EMail
FROM dbo.Benutzer
UNION ALL
SELECT EMail
FROM dbo.Benutzer
WHERE param1 = 1
UNION ALL
SELECT EMail
FROM dbo.Benutzer
WHERE param2 = 1
) AS EMail
ORDER BY NEWID();
示例表:
EMail           param1      param2
______________|_________|___________
Test@test.com |0 | 0 -> probability is 1 (normal)
Test1@test.com|1 | 0 -> probability is 2 (higher than 1)
Test2@test.com|1 | 0 -> probability is 2 (higher than 1)
Test3@test.com|1 | 1 -> probability is 3 (higher than 1 and 2)
Test4@test.com|1 | 0 -> probability is 2 (higher than 1)
Test5@test.com|1 | 0 -> probability is 2 (higher than 1)
因此,如果我从该表中进行选择并在此之前对其进行洗牌,那么每个新选择的不同数据都会出现,概率应该基于该表。那么这个条目出现的可能性有多大。
总是两个不同的用户应该出来。例如测试 3 和测试 4。但是,也测试 unf Test3 所以它应该只是一个概率。
但是,此查询未执行。如何以高性能的方式解决这个问题?

最佳答案

更新答案:
似乎您想以更高的概率随机选择每封电子邮件的一行。在这种情况下,您需要对每个不同的电子邮件的行进行编号:

SELECT *
INTO Benutzer
FROM (VALUES
('Test@test.com', 0, 0),
('Test1@test.com', 1, 0),
('Test2@test.com', 1, 0),
('Test3@test.com', 1, 1),
('Test4@test.com', 1, 0),
('Test5@test.com', 1, 0)
) v (EMail, param1, param2)

SELECT TOP 2 Email
FROM (
SELECT b.*, ROW_NUMBER() OVER (PARTITION BY b.Email ORDER BY a.probability DESC) AS rn
FROM Benutzer b
CROSS APPLY (VALUES
(1), -- normal probability
(
1 +
CASE WHEN param1 = 1 THEN 1 ELSE 0 END +
CASE WHEN param2 = 1 THEN 1 ELSE 0 END
) -- calculated probability
) a (probability)
) t
WHERE t.rn = 1
ORDER BY NEWID()
最后,您可以尝试对行进行随机编号:
ROW_NUMBER() OVER (PARTITION BY b.Email ORDER BY NEWID()) AS rn
原答案:
如果我正确理解了这个问题,您只需要根据所需条件计算每一行的概率:
SELECT TOP 2 EMail
FROM (VALUES
('Test@test.com', 0, 0),
('Test1@test.com', 1, 0),
('Test2@test.com', 1, 0),
('Test3@test.com', 1, 1),
('Test4@test.com', 1, 0),
('Test5@test.com', 1, 0)
) Benutzer (EMail, param1, param2)
ORDER BY
(
1 +
CASE WHEN param1 = 1 THEN 1 ELSE 0 END +
CASE WHEN param2 = 1 THEN 1 ELSE 0 END
) DESC,
NEWID()
重要说明(基于@GordonLinoff 的评论) - 如果 NEWID()是一阶表达式,二阶by表达式被忽略,所以我放了 NEWID()作为二阶表达式(这是答案的第一个版本)。但是,在这种情况下,行是 不是 随机返回。

关于sql - 用选择概率优化 T-SQL 查询,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68451939/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com