T-SQL:从列计算第N个百分位值

jbe*_*ock 6 sql t-sql

我有一列数据,其中一些是NULL值,我希望从中提取单个第90百分位:

ColA
-----
NULL
100
200
300
NULL
400
500
600
700
800
900
1000
Run Code Online (Sandbox Code Playgroud)

对于上述,我正在寻找一种技术,当搜索第90百分位数时返回值900,将第80百分位数返回800,等等.类似的函数将是AVG(ColA),其返回550以获得上述数据,或MIN(返回100等的ColA)

有什么建议?

Gor*_*off 9

如果你想准确得到第90个百分位值,不包括NULL,我建议你直接进行计算.以下版本计算行数和行数,并选择适当的值:

select max(case when rownum*1.0/numrows <= 0.9 then colA end) as percentile_90th
from (select colA,
             row_number() over (order by colA) as rownum,
             count(*) over (partition by NULL) as numrows
      from t
      where colA is not null
     ) t
Run Code Online (Sandbox Code Playgroud)

我将条件放在SELECT子句而不是WHERE子句中,因此您可以轻松获得第50个百分位数,第17个或任何您想要的值.


Mat*_*lie 6

WITH
  percentiles AS
(
  SELECT
    NTILE(100) OVER (ORDER BY ColA) AS percentile,
    *
  FROM
    data
)
SELECT
  *
FROM
  percentiles
WHERE
  percentile = 90
Run Code Online (Sandbox Code Playgroud)


注意:如果数据少于 100 个观测值,则并非所有百分位数都有值。同样,如果您有超过 100 个观测值,某些百分位数将包含更多值。