如何在SQL Query中获取Distinct值

Ahm*_*asi 9 sql sql-server

我的SQL查询有问题

我想选择DISTINCT StudentGroups(SG),但查询给了我一些重复

这是我的查询

SELECT      DISTINCT(SG.SGID), en.EnrollmentID, CR.Name AS Course, INS.Name as Instructor,
                S.Session, SG.StartTime, SG.EndTime, EN.CreateDate

    FROM        StudentGroups SG inner JOIN Enrollments EN ON SG.SGID = EN.SGID
                JOIN Courses CR ON SG.CourseID = CR.CourseID
                JOIN Class CL ON SG.ClassID = CL.ClassID
                JOIN Instructors INS ON SG.InstructorID = INS.InstructorID
                JOIN Sessions S ON SG.SessionID = S.SessionID

    WHERE       EN.SGID NOT IN ( SELECT SGID FROM Enrollments
                            WHERE StudentID = 45
Run Code Online (Sandbox Code Playgroud)

更新

此查询为我提供了以下数据

在此输入图像描述

但我不想重复SGID

小智 14

DISTINCT始终适用于返回的所有列.将括号括在一列上对其行为没有影响.

如果希望结果仅包含唯一值SG.GID,则可以使用GROUP BY子句 - 但是您必须确定要在其他列中返回哪些值的规则.通过使用像聚合函数做到这一点MIN(),MAX(),COUNT(),SUM(),等简单的例子:

SELECT  SG.SGID,
        MIN(SG.START_TIME),              --the lowest start time for this sgid.
        COUNT(DISTINCT en.EnrollmentID)  --the unique enrollments for this sgid.
    FROM StudentGroups SG 
    INNER JOIN Enrollments EN ON SG.SGID = EN.SGID
    GROUP BY SG.SGID;
Run Code Online (Sandbox Code Playgroud)

在原始查询中连接多个表时,在计算和求和时必须小心,因为连接中的重复可能会给您不正确的结果.

另一种选择是使用ROW_NUMBER()每个返回一行SGID:

SELECT * FROM (
    SELECT  SG.SGID,
            SG.START_TIME, 
            en.EnrollmentID,
            ROW_NUMBER() OVER (PARTITION BY SGID ORDER BY SG.START_TIME) as RN
        FROM StudentGroups SG 
        INNER JOIN Enrollments EN ON SG.SGID = EN.SGID
    )
    WHERE RN = 1;
Run Code Online (Sandbox Code Playgroud)

这会为每个行编号SGID,从1开始并按值排序SG.START_TIME.它将返回一行,每行最早的开始时间SGID.如果多行具有相同的开始时间,则会随机选择其中任何一行,或多或少.您可以向ORDER BY子句添加更多字段以进一步定义返回的行.


Gee*_*eek 6

当DISTINCT不能用于您想要的输出时,请使用GROUP BY子句.