考虑下表,
CREATE TABLE GapsIslands (ID INT NOT NULL, SeqNo INT NOT NULL);
ALTER TABLE GapsIslands ADD CONSTRAINT pk_GapsIslands PRIMARY KEY (ID, SeqNo);
INSERT INTO GapsIslands
SELECT 1, 1 UNION ALL SELECT 1, 2 UNION ALL SELECT 1, 5 UNION ALL SELECT 1, 6
UNION ALL SELECT 1, 8 UNION ALL SELECT 1, 9 UNION ALL SELECT 1, 10 UNION ALL SELECT 1, 12
UNION ALL SELECT 1, 20 UNION ALL SELECT 1, 21 UNION ALL SELECT 1, 25 UNION ALL SELECT 1, 26;
Run Code Online (Sandbox Code Playgroud)
我正在努力理解NOT EXISTS
条件在差距和岛屿解决方案的背景下的应用。
以下查询旨在查找“岛屿”的起点:
SELECT ID, SeqNo, ROW_NUMBER() OVER (ORDER BY SeqNo) AS RowNum
FROM GapsIslands AS a
WHERE NOT EXISTS (
SELECT *
FROM GapsIslands AS b
WHERE b.ID = a.ID AND b.SeqNo = a.SeqNo - 1)
Run Code Online (Sandbox Code Playgroud)
现在在 NOT EXISTS 条件中的查询,
SELECT *
FROM GapsIslands AS b
WHERE b.ID = a.ID AND b.SeqNo = a.SeqNo - 1
Run Code Online (Sandbox Code Playgroud)
返回,该列(我们称此列为 A)SeqNo 为:
SeqNo
1
5
8
9
20
25
Run Code Online (Sandbox Code Playgroud)
SeqNo 的“完整”列(我们称之为 B 列)是:
SeqNo
1
2
5
6
8
9
10
12
20
21
25
26
Run Code Online (Sandbox Code Playgroud)
那么,为什么当我们在 A 列中取 B 列值 WHERE NOT EXISTS 时,我们是否找到该列
SeqNo
1
5
8
12
20
25
Run Code Online (Sandbox Code Playgroud)
B列中的值1也在A列中,那么为什么值1作为一个整体出现在查询的SeqNo列中呢?
让我们将有问题的表达式从WHERE
条件移动到SELECT
输出列表。EXISTS
给出布尔值,而 SQL Server 不想直接显示它,所以我们将使用CASE
它并将其转换为可读形式。
SELECT ID, SeqNo, ROW_NUMBER() OVER (ORDER BY SeqNo) AS RowNum
/* There we insert our EXISTS moved from WHERE */
/* and wrapped into CASE */
, CASE WHEN EXISTS ( SELECT *
FROM GapsIslands AS b
WHERE b.ID = a.ID
AND b.SeqNo = a.SeqNo - 1 )
THEN 'Exists' /* EXISTS is true there, NOT EXISIS is false */
ELSE 'Not exists' /* NOT EXISTS is true there, EXISIS is false */
END AS previous_SeqNo_exists
/* ----------------------------------------------- */
FROM GapsIslands AS a
ORDER BY SeqNo
Run Code Online (Sandbox Code Playgroud)
该查询为我们提供了下一个输出:
身份证 | 序列号 | 行数 | previous_SeqNo_exists -: | ----: | :----- | :-------------------- 1 | 1 | 1 | 不存在 1 | 2 | 2 | 存在 1 | 5 | 3 | 不存在 1 | 6 | 4 | 存在 1 | 8 | 5 | 不存在 1 | 9 | 6 | 存在 1 | 10 | 7 | 存在 1 | 12 | 8 | 不存在 1 | 20 | 9 | 不存在 1 | 21 | 10 | 存在 1 | 25 | 11 | 不存在 1 | 26 | 12 | 存在
似乎是绝对清楚的。SeqNo=1 没有以前的值,因为根本没有这样的记录,SeqNo=5(还有其他的)——因为之前有一个间隙。
当我们EXISTS
在WHERE
带有“Exists”的记录中使用这个表达式时,我们将只获取带有“Notexists”的记录(不要忘记还有额外的NOT
操作符,所以只会FALSE
返回给出的记录)。
ROW_NUMBER()
,在 之后工作WHERE
,简单地以给定的顺序枚举返回的记录。
附注。正在考虑的查询(由 OP 发布)不包含 ORDER BY 子句。那很不好。这可能会导致记录以随机顺序返回。尽管如此,由 计算的记录数ROW_NUMBER()
将是正确的,因为该函数有其自己的本地排序。
归档时间: |
|
查看次数: |
377 次 |
最近记录: |