SQLite 中的移动平均线

Max*_*ime 3 sqlite moving-average

我想计算 SQLite 表中数据的移动平均值。我在 MySQL 中找到了几种方法,但在 SQLite 中找不到有效的方法。

在 SQL 中,我认为应该这样做(但是,我无法尝试...):

SELECT date, value, 
avg(value) OVER (ORDER BY date ROWS BETWEEN 3 PRECEDING AND 3 FOLLOWING) as MovingAverageWindow7
FROM t ORDER BY date;
Run Code Online (Sandbox Code Playgroud)

但是,我看到了两个缺点:

  • 这似乎不适用于 sqlite
  • 如果数据在前面/后面几行的几个日期不连续,它会在比我实际想要的更宽的窗口上计算移动平均值,因为它仅基于周围的行数。因此,应添加日期条件

实际上,我希望它计算每个日期的“价值”平均值,超过 +/-3 天(每周移动平均线)或 +/-15 天(每月移动平均线)

这是一个示例数据集:

CREATE TABLE t ( date DATE, value INTEGER );

INSERT INTO t (date, value) VALUES ('2018-02-01', 8);
INSERT INTO t (date, value) VALUES ('2018-02-02', 2);
INSERT INTO t (date, value) VALUES ('2018-02-05', 5);
INSERT INTO t (date, value) VALUES ('2018-02-06', 4);
INSERT INTO t (date, value) VALUES ('2018-02-07', 1);
INSERT INTO t (date, value) VALUES ('2018-02-10', 6);
INSERT INTO t (date, value) VALUES ('2018-02-11', 0);
INSERT INTO t (date, value) VALUES ('2018-02-12', 2);
INSERT INTO t (date, value) VALUES ('2018-02-13', 1);
INSERT INTO t (date, value) VALUES ('2018-02-14', 3);
INSERT INTO t (date, value) VALUES ('2018-02-15', 11);
INSERT INTO t (date, value) VALUES ('2018-02-18', 4);
INSERT INTO t (date, value) VALUES ('2018-02-20', 1);
INSERT INTO t (date, value) VALUES ('2018-02-21', 5);
INSERT INTO t (date, value) VALUES ('2018-02-28', 10);
INSERT INTO t (date, value) VALUES ('2018-03-02', 6);
INSERT INTO t (date, value) VALUES ('2018-03-03', 7);
INSERT INTO t (date, value) VALUES ('2018-03-04', 3);
INSERT INTO t (date, value) VALUES ('2018-03-08', 5);
INSERT INTO t (date, value) VALUES ('2018-03-09', 6);
INSERT INTO t (date, value) VALUES ('2018-03-15', 1);
INSERT INTO t (date, value) VALUES ('2018-03-16', 3);
INSERT INTO t (date, value) VALUES ('2018-03-25', 5);
INSERT INTO t (date, value) VALUES ('2018-03-31', 1);
Run Code Online (Sandbox Code Playgroud)

For*_*Bot 6

在 3.25.0 (2018-09-15) 版本中添加了窗口函数。随着版本 3.28.0 (2019-04-16) 中添加的 RANGE 帧类型,您现在可以执行以下操作:

SELECT date, value, 
avg(value) OVER (
    ORDER BY CAST (strftime('%s', date) AS INT)
    RANGE BETWEEN 3 * 24 * 60 * 60 PRECEDING
        AND 3 * 24 * 60 * 60 FOLLOWING
) AS MovingAverageWindow7
FROM t ORDER BY date;
Run Code Online (Sandbox Code Playgroud)


Max*_*ime 5

我想我实际上找到了一个解决方案:

SELECT date, value, 
  (SELECT AVG(value) FROM t t2 
   WHERE datetime(t1.date, '-3 days') <= datetime(t2.date) AND datetime(t1.date, '+3 days') >= datetime(t2.date)
   ) AS MAVG
FROM t t1
GROUP BY strftime('%Y-%m-%d', date); 
Run Code Online (Sandbox Code Playgroud)

在此处输入图片说明

我不知道这是否是最有效的方式,但它似乎有效

编辑: 应用于包含 20 000 行的真实数据库,计算两个参数的每周移动平均值大约需要 1 分钟。

我在那里看到两个选项:

  • 使用 SQLite 有一种更有效的方法来计算它
  • 从 SQLite 中提取数据后,我在 Python 中计算了移动平均值