我有一个情况,我有一个巨大的表,包含大量的行,看起来像(例如):
id Timestamp Value
14574499 2011-09-28 08:33:32.020 99713.3000
14574521 2011-09-28 08:33:42.203 99713.3000
14574540 2011-09-28 08:33:47.017 99713.3000
14574559 2011-09-28 08:38:53.177 99720.3100
14574578 2011-09-28 08:38:58.713 99720.3100
14574597 2011-09-28 08:39:03.590 99720.3100
14574616 2011-09-28 08:39:08.950 99720.3100
14574635 2011-09-28 08:39:13.793 99720.3100
14574654 2011-09-28 08:39:19.063 99720.3100
14574673 2011-09-28 08:39:23.780 99720.3100
14574692 2011-09-28 08:39:29.167 99758.6400
14574711 2011-09-28 08:39:33.967 99758.6400
14574730 2011-09-28 08:39:40.803 99758.6400
14574749 2011-09-28 08:39:49.297 99758.6400
Run Code Online (Sandbox Code Playgroud)
好的,所以规则是:时间戳可以是任意n秒,5s,30s,60s等,它取决于记录的年龄(存档发生).
我希望能够查询此表以根据时间戳选择每个第n行.
例如:
从mytable中选择*,其中intervalBetweenTheRows = 30s
(出于这个问题的目的,基于假设,所请求的间隔总是比数据库中的可用精度更高)
所以,每第n行根据每行之间的时间
有任何想法吗?!
卡尔
对于那些感兴趣的人来说,递归CTE实际上非常慢,我想到了一个稍微不同的方法:
SELECT TOP 500
MIN(pvh.[TimeStamp]) as [TimeStamp],
AVG(pvh.[Value]) as [Value]
FROM
PortfolioValueHistory pvh
WHERE
pvh.PortfolioID = @PortfolioID
AND pvh.[TimeStamp] >= @StartDate
AND pvh.[TimeStamp] <= @EndDate
GROUP BY
FLOOR(DateDiff(Second, '01/01/2011 00:00:00', pvh.[TimeStamp]) / @ResolutionInSeconds)
ORDER BY
[TimeStamp] ASC
Run Code Online (Sandbox Code Playgroud)
我把时间戳减去一个任意的日期来给出一个基本的int来使用,然后将它除以我想要的分辨率,然后按此分组,取最小时间戳(邮票的'区域'的第一个)和该"期间"的平均值.
这用于绘制历史数据的图表,因此平均值对我很好.
这是我能够提出的基于表大小的最快执行
谢谢你的帮助.
假设要求是否返回行的决定因素取决于上一个返回行所经过的时间,这需要一种过程方法。不过,递归 CTE 可能比游标更有效。
WITH RecursiveCTE
AS (SELECT TOP 1 *
FROM @T
ORDER BY [Timestamp]
UNION ALL
SELECT id,
[Timestamp],
Value
FROM (
--Can't use TOP directly
SELECT T.*,
rn = ROW_NUMBER() OVER (ORDER BY T.[Timestamp])
FROM @T T
JOIN RecursiveCTE R
ON T.[Timestamp] >=
DATEADD(SECOND, 30, R.[Timestamp])) R
WHERE R.rn = 1)
SELECT *
FROM RecursiveCTE
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
4385 次 |
| 最近记录: |