我想通过时间戳来执行移动平均线.
我有两列:温度和时间戳(时间 – 日期),我想根据连续的温度观测每15分钟执行移动平均.换句话说,选择数据以执行基于15分钟时间间隔的平均值.此外,可以对不同的时间序列具有不同数量的观测值.我的意思是所有的窗口大小相等(15分钟),但是可以在每个窗口中有不同的观察次数.
例如:
对于第一个窗口,我们必须计算n次观察的平均值,而第二个窗口计算n 5次观测的平均值.
我有两列:温度和时间戳(时间 – 日期),我想根据连续的温度观测每15分钟执行移动平均.换句话说,选择数据以执行基于15分钟时间间隔的平均值.此外,可以对不同的时间序列具有不同数量的观测值.我的意思是所有的窗口大小相等(15分钟),但是可以在每个窗口中有不同的观察次数.
例如:
对于第一个窗口,我们必须计算n次观察的平均值,而第二个窗口计算n 5次观测的平均值.
资料样本:
ID Timestamps Temperature 1 2007-09-14 22:56:12 5.39 2 2007-09-14 22:58:12 5.34 3 2007-09-14 23:00:12 5.16 4 2007-09-14 23:02:12 5.54 5 2007-09-14 23:04:12 5.30 6 2007-09-14 23:06:12 5.20 7 2007-09-14 23:10:12 5.39 8 2007-09-14 23:12:12 5.34 9 2007-09-14 23:20:12 5.16 10 2007-09-14 23:24:12 5.54 11 2007-09-14 23:30:12 5.30 12 2007-09-14 23:33:12 5.20 13 2007-09-14 23:40:12 5.39 14 2007-09-14 23:42:12 5.34 15 2007-09-14 23:44:12 5.16 16 2007-09-14 23:50:12 5.54 17 2007-09-14 23:52:12 5.30 18 2007-09-14 23:57:12 5.20
主要挑战:
由于采样频率不同,每隔15分钟就不会有15分钟的时间间隔来学习代码.
假设您要在每15分钟间隔后重新启动滚动平均值:
select id,temp,avg(temp) over (partition by group_nr order by time_read) as rolling_avg from ( select id,time_read,interval_group,id - row_number() over (partition by interval_group order by time_read) as group_nr from ( select id,'epoch'::timestamp + '900 seconds'::interval * (extract(epoch from time_read)::int4 / 900) as interval_group,temp from readings ) t1 ) t2 order by time_read;
它基于Depesz’s solution按“时间范围”分组:
这是一个sqlFiddle示例:http://sqlfiddle.com/#!1/0f3f0/2