SQL以不同的间隔选择行

Sto*_*ono 6 sql sql-server

我有一个情况,我有一个巨大的表,包含大量的行,看起来像(例如):

id          Timestamp               Value
14574499    2011-09-28 08:33:32.020 99713.3000
14574521    2011-09-28 08:33:42.203 99713.3000
14574540    2011-09-28 08:33:47.017 99713.3000
14574559    2011-09-28 08:38:53.177 99720.3100
14574578    2011-09-28 08:38:58.713 99720.3100
14574597    2011-09-28 08:39:03.590 99720.3100
14574616    2011-09-28 08:39:08.950 99720.3100
14574635    2011-09-28 08:39:13.793 99720.3100
14574654    2011-09-28 08:39:19.063 99720.3100
14574673    2011-09-28 08:39:23.780 99720.3100
14574692    2011-09-28 08:39:29.167 99758.6400
14574711    2011-09-28 08:39:33.967 99758.6400
14574730    2011-09-28 08:39:40.803 99758.6400
14574749    2011-09-28 08:39:49.297 99758.6400
Run Code Online (Sandbox Code Playgroud)

好的,所以规则是:时间戳可以是任意n秒,5s,30s,60s等,它取决于记录的年龄(存档发生).

我希望能够查询此表以根据时间戳选择每个第n行.

例如:

从mytable中选择*,其中intervalBetweenTheRows = 30s

(出于这个问题的目的,基于假设,所请求的间隔总是比数据库中的可用精度更高)

所以,每第n行根据每行之间的时间

有任何想法吗?!

卡尔

对于那些感兴趣的人来说,递归CTE实际上非常慢,我想到了一个稍微不同的方法:

SELECT TOP 500
    MIN(pvh.[TimeStamp]) as [TimeStamp],
    AVG(pvh.[Value]) as [Value]
FROM
    PortfolioValueHistory pvh
WHERE
    pvh.PortfolioID = @PortfolioID
    AND pvh.[TimeStamp] >= @StartDate
    AND pvh.[TimeStamp] <= @EndDate
GROUP BY
    FLOOR(DateDiff(Second, '01/01/2011 00:00:00', pvh.[TimeStamp]) / @ResolutionInSeconds)
ORDER BY 
    [TimeStamp] ASC
Run Code Online (Sandbox Code Playgroud)

我把时间戳减去一个任意的日期来给出一个基本的int来使用,然后将它除以我想要的分辨率,然后按此分组,取最小时间戳(邮票的'区域'的第一个)和该"期间"的平均值.

这用于绘制历史数据的图表,因此平均值对我很好.

这是我能够提出的基于表大小的最快执行

谢谢你的帮助.

Mar*_*ith 3

假设要求是否返回行的决定因素取决于上一个返回行所经过的时间,这需要一种过程方法。不过,递归 CTE 可能比游标更有效。

WITH RecursiveCTE
     AS (SELECT TOP 1 *
         FROM @T
         ORDER BY [Timestamp]
         UNION ALL
         SELECT id,
                [Timestamp],
                Value
         FROM   (
                --Can't use TOP directly
                SELECT T.*,
                       rn = ROW_NUMBER() OVER (ORDER BY T.[Timestamp])
                 FROM   @T T
                        JOIN RecursiveCTE R
                          ON T.[Timestamp] >=
                                 DATEADD(SECOND, 30, R.[Timestamp])) R
         WHERE  R.rn = 1)
SELECT *
FROM RecursiveCTE
Run Code Online (Sandbox Code Playgroud)