gpt4 book ai didi

mysql - 比较 SQL 表行,如果完全匹配则返回不同的答案,1 个差异,2 个差异等

转载 作者:行者123 更新时间:2023-11-30 22:36:02 24 4
gpt4 key购买 nike

我正在尝试找出处理大型数据集的最佳方法,看起来使用 Access/SQL 表可能是最好的方法(尽管甚至 Excel 和 VBA 也可能有用)。在四处搜索之后,没有找到完全匹配的结果。

我有一个看起来像下表的东西,想知道在一个结果中是否有任何行完全匹配。我还想知道除了 1 个差异或 2 个差异等之外匹配的行(这些可以被视为单独的查询)。

例如,在下面的示例中,输出将显示 A 和 B 在完全匹配下匹配,A 和 C 匹配只有一个差异(B 和 C 也是如此)。 D 与 B 和 C 有 1 个不匹配,但与 A 有 2 个不匹配。

然后更上一层楼,如果我想简单地说 D 行(如在用户选择中而不是仅仅扫描上面的整个数据库)是否有任何匹配项,将如何为此调整查询?

+------+--------+--------+--------+--------+--------+
| Item | Score1 | Score2 | Score3 | Score4 | Score5 |
+------+--------+--------+--------+--------+--------+
| A | 1 | 1 | 2 | 1 | 1 |
| B | 1 | 1 | 2 | 1 | 1 |
| C | 1 | 1 | 1 | 1 | 1 |
| D | 0 | 1 | 1 | 1 | 1 |
+------+--------+--------+--------+--------+--------+

非常感谢!

最佳答案

考虑以下带有六个 GROUP BY 子查询的 MS Access 查询,它确实显示了哪些项目在所有列中匹配。但对于其他列差异,查询会呈现一种仪表板供用户决定匹配。

查询背后的概念是将所有分数连接成一个字符串(例如,11211、1111、01111),然后逐个字符检查(使用 LeftMid() string functions) 项目中有多少个字符数大于 1。此外,对于多次重复出现,我必须使用 @

SELECT t1.Item, 
(t1.Score1 & t1.Score2 & t1.Score3 & t1.Score4 & t1.Score5) AS StringScores,

(SELECT 'Yes'
FROM Scores t2
WHERE (t1.Score1 & t1.Score2 & t1.Score3 & t1.Score4 & t1.Score5)=
(t2.Score1 & t2.Score2 & t2.Score3 & t2.Score4 & t2.Score5)
GROUP BY 'Yes', Cstr(t2.Score1 & t2.Score2 & t2.Score3 & t2.Score4 & t2.Score5)
HAVING Count(*) > 1) AS [All Five Scores Match ?],

(SELECT 'Yes @ ' & Left((t3.Score1 & t3.Score2 & t3.Score3 & t3.Score4 & t3.Score5), 1)
FROM Scores t3
WHERE Left((t1.Score1 & t1.Score2 & t1.Score3 & t1.Score4 & t1.Score5), 1)=
Left((t3.Score1 & t3.Score2 & t3.Score3 & t3.Score4 & t3.Score5), 1)
GROUP BY 'Yes @ ' & Left((t3.Score1 & t3.Score2 & t3.Score3 & t3.Score4 & t3.Score5), 1)
HAVING Count(*) > 1) AS [First Score Matches ?],

(SELECT 'Yes @ ' & Mid((t4.Score1 & t4.Score2 & t4.Score3 & t4.Score4 & t4.Score5), 2, 1)
FROM Scores t4
WHERE Mid((t1.Score1 & t1.Score2 & t1.Score3 & t1.Score4 & t1.Score5), 2, 1)=
Mid((t4.Score1 & t4.Score2 & t4.Score3 & t4.Score4 & t4.Score5), 2, 1)
GROUP BY 'Yes @ ' & Mid((t4.Score1 & t4.Score2 & t4.Score3 & t4.Score4 & t4.Score5), 2, 1)
HAVING Count(*) > 1) AS [Second Score Matches ?],

(SELECT 'Yes @ ' & Mid((t5.Score1 & t5.Score2 & t5.Score3 & t5.Score4 & t5.Score5), 3, 1)
FROM Scores t5
WHERE Mid((t1.Score1 & t1.Score2 & t1.Score3 & t1.Score4 & t1.Score5), 3, 1)=
Mid((t5.Score1 & t5.Score2 & t5.Score3 & t5.Score4 & t5.Score5), 3, 1)
GROUP BY 'Yes @ ' & Mid((t5.Score1 & t5.Score2 & t5.Score3 & t5.Score4 & t5.Score5), 3, 1)
HAVING Count(*) > 1) AS [Third Score Matches ?],

(SELECT 'Yes @ ' & Mid((t6.Score1 & t6.Score2 & t6.Score3 & t6.Score4 & t6.Score5), 4, 1)
FROM Scores t6
WHERE Mid((t1.Score1 & t1.Score2 & t1.Score3 & t1.Score4 & t1.Score5), 4, 1)=
Mid((t6.Score1 & t6.Score2 & t6.Score3 & t6.Score4 & t6.Score5), 4, 1)
GROUP BY 'Yes @ ' & Mid((t6.Score1 & t6.Score2 & t6.Score3 & t6.Score4 & t6.Score5), 4, 1)
HAVING Count(*) > 1) AS [Fourth Score Matches ?],

(SELECT 'Yes @ ' & Mid((t7.Score1 & t7.Score2 & t7.Score3 & t7.Score4 & t7.Score5), 5, 1)
FROM Scores t7
WHERE Mid((t1.Score1 & t1.Score2 & t1.Score3 & t1.Score4 & t1.Score5), 5, 1) =
Mid((t7.Score1 & t7.Score2 & t7.Score3 & t7.Score4 & t7.Score5), 5, 1)
GROUP BY 'Yes @ ' & Mid((t7.Score1 & t7.Score2 & t7.Score3 & t7.Score4 & t7.Score5), 5, 1)
HAVING Count(*) > 1) AS [Fifth Score Matches ?]

FROM Scores AS t1;

下面是输出。如您所见,用户可以通过第一列(主要内容)判断 A 和 B 在所有 5 个分数中完全匹配;和 C & D 匹配所有四个分数,除了第一; C 在除第三个分数之外的所有分数上匹配前两个项目 A 和 B; D 匹配前两个 A 和 B,除了第一和第三分数。

Scores Match - Short Output

然后我继续测试了另外四种可能的分数:

Scores Match - Long Output

不可否认,这些输出可能看起来像是对原始表格的重新样式化,但请记住,只会出现大于 1 的事件。您可以将此查询输出到表中并进行过滤/排序以更清楚地查看模式。

最后,如果您需要检查前三个分数、最后两个分数或多个分数的任意组合,则可以扩展此功能。只需使用 Left(StringScores, 2)Mid(StringScores, 4, 2) 字符串函数添加相应的子查询。

关于mysql - 比较 SQL 表行,如果完全匹配则返回不同的答案,1 个差异,2 个差异等,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32524232/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com