理解不存在

TMi*_*man 4 sql-server

考虑下表,

CREATE TABLE GapsIslands (ID INT NOT NULL, SeqNo INT NOT NULL);

ALTER TABLE GapsIslands ADD CONSTRAINT pk_GapsIslands PRIMARY KEY (ID, SeqNo);

INSERT INTO GapsIslands
SELECT 1, 1 UNION ALL SELECT 1, 2 UNION ALL SELECT 1, 5 UNION ALL SELECT 1, 6 
UNION ALL SELECT 1, 8 UNION ALL SELECT 1, 9 UNION ALL SELECT 1, 10 UNION ALL SELECT 1, 12 
UNION ALL SELECT 1, 20 UNION ALL SELECT 1, 21 UNION ALL SELECT 1, 25 UNION ALL SELECT 1, 26;  

Run Code Online (Sandbox Code Playgroud)

我正在努力理解NOT EXISTS条件在差距和岛屿解决方案的背景下的应用。

以下查询旨在查找“岛屿”的起点:

SELECT ID, SeqNo, ROW_NUMBER() OVER (ORDER BY SeqNo) AS RowNum
FROM GapsIslands AS a
WHERE NOT EXISTS ( 
    SELECT  * 
    FROM GapsIslands AS b
    WHERE b.ID = a.ID AND b.SeqNo = a.SeqNo - 1)
Run Code Online (Sandbox Code Playgroud)

现在在 NOT EXISTS 条件中的查询,

SELECT  * 
    FROM GapsIslands AS b
    WHERE b.ID = a.ID AND b.SeqNo = a.SeqNo - 1
Run Code Online (Sandbox Code Playgroud)

返回,该列(我们称此列为 A)SeqNo 为:

 SeqNo      
  1     
  5     
  8     
  9     
  20        
  25        
Run Code Online (Sandbox Code Playgroud)

SeqNo 的“完整”列(我们称之为 B 列)是:

  SeqNo     
  1     
  2     
  5     
  6     
  8     
  9
  10        
  12        
  20        
  21        
  25
  26
Run Code Online (Sandbox Code Playgroud)

那么,为什么当我们在 A 列中取 B 列值 WHERE NOT EXISTS 时,我们是否找到该列

 SeqNo      
  1     
  5     
  8     
  12        
  20        
  25
Run Code Online (Sandbox Code Playgroud)

B列中的值1也在A列中,那么为什么值1作为一个整体出现在查询的SeqNo列中呢?

Aki*_*ina 5

让我们将有问题的表达式从WHERE条件移动到SELECT输出列表。EXISTS给出布尔值,而 SQL Server 不想直接显示它,所以我们将使用CASE它并将其转换为可读形式。

SELECT ID, SeqNo, ROW_NUMBER() OVER (ORDER BY SeqNo) AS RowNum
/*   There we insert our EXISTS moved from WHERE   */
/*              and wrapped into CASE              */
, CASE WHEN EXISTS ( SELECT  * 
                     FROM GapsIslands AS b
                     WHERE b.ID = a.ID 
                       AND b.SeqNo = a.SeqNo - 1 )
       THEN 'Exists'      /* EXISTS is true there, NOT EXISIS is false */
       ELSE 'Not exists'  /* NOT EXISTS is true there, EXISIS is false */
       END AS previous_SeqNo_exists
/* ----------------------------------------------- */
FROM GapsIslands AS a
ORDER BY SeqNo
Run Code Online (Sandbox Code Playgroud)

小提琴

该查询为我们提供了下一个输出:

身份证 | 序列号 | 行数 | previous_SeqNo_exists
-: | ----: | :----- | :--------------------
 1 | 1 | 1 | 不存在           
 1 | 2 | 2 | 存在               
 1 | 5 | 3 | 不存在           
 1 | 6 | 4 | 存在               
 1 | 8 | 5 | 不存在           
 1 | 9 | 6 | 存在               
 1 | 10 | 7 | 存在               
 1 | 12 | 8 | 不存在           
 1 | 20 | 9 | 不存在           
 1 | 21 | 10 | 存在               
 1 | 25 | 11 | 不存在           
 1 | 26 | 12 | 存在               

似乎是绝对清楚的。SeqNo=1 没有以前的值,因为根本没有这样的记录,SeqNo=5(还有其他的)——因为之前有一个间隙。

当我们EXISTSWHERE带有“Exists”的记录中使用这个表达式时,我们将只获取带有“Notexists”的记录(不要忘记还有额外的NOT操作符,所以只会FALSE返回给出的记录)。

ROW_NUMBER(),在 之后工作WHERE,简单地以给定的顺序枚举返回的记录。

附注。正在考虑的查询(由 OP 发布)不包含 ORDER BY 子句。那很不好。这可能会导致记录以随机顺序返回。尽管如此,由 计算的记录数ROW_NUMBER()将是正确的,因为该函数有其自己的本地排序。