Est*_*tel 2 sql presto apache-zeppelin
我正在使用 Presto 和 Zeppelin。有很多原始数据。我必须总结这些数据。
我想每 5 秒分组一次。
serviceType logType date
------------------------------------------------------
service1 log1 2017-10-24 23:00:23.206
service1 log1 2017-10-24 23:00:23.207
service1 log1 2017-10-24 23:00:25.206
service2 log1 2017-10-24 23:00:24.206
service1 log2 2017-10-24 23:00:27.206
service1 log2 2017-10-24 23:00:29.302
Run Code Online (Sandbox Code Playgroud)
那么结果
serviceType logType date cnt
--------------------------------------------------------------
service1 log1 2017-10-24 23:00:20 2
service2 log1 2017-10-24 23:00:20 1
service1 log1 2017-10-24 23:00:25 1
service1 log2 2017-10-24 23:00:25 2
Run Code Online (Sandbox Code Playgroud)
首先,我必须将存储的数据迁移到新表。
其次,我必须对数据进行分组并实时保存到新表中。
很难写sql脚本。
请帮我。
我必须使用 python 解释器吗?
你可以
timestampwith 的毫秒部分date_trunctimestamp没有毫秒部分的四舍五入到 5 秒ts - interval '1' second * (second(ts) % 5)将这些放在一起的示例:
presto> SELECT ts_rounded, count(*)
-> FROM (
-> SELECT date_trunc('second', ts) - interval '1' second * (second(ts) % 5) AS ts_rounded
-> FROM (VALUES timestamp '2017-10-24 23:01:20.206',
-> timestamp '2017-10-24 23:01:23.206',
-> timestamp '2017-10-24 23:01:23.207',
-> timestamp '2017-10-24 23:01:26.206') AS t(ts)
-> )
-> GROUP BY ts_rounded ORDER BY ts_rounded;
ts_rounded | _col1
-------------------------+-------
2017-10-24 23:01:20.000 | 3
2017-10-24 23:01:25.000 | 1
(2 rows)
Run Code Online (Sandbox Code Playgroud)