这是给您的难题:
我将群集计算的统计信息保存在名为“ jobs”的MySQL表中.每个作业行都有一个执行作业的主机(不是唯一的),一个作业执行时间(以秒为单位)以及一个唯一的整数作为PK,因此我可以简单地通过订购PK来订购完成的作业.
截至目前,使用average和group by,我可以找到所有已完成作业中每个主机的平均执行时间(以秒为单位).我想要平均每个主机最近五个作业的平均时间,而不是平均每个主机的所有执行时间.
有各种各样的操作和分组依据示例,还有很多有限制的操作示例,但是有没有办法在一个相当简单的MySQL查询中将两者结合起来?
编辑:如果我不清楚,我希望主机1的平均执行时间为5,主机2的平均执行时间为5,等等.
最佳答案
我最初的反应是使用LIMIT将平均值限制为5个结果,这使我建议:
select a.host,avg(a.execution_time) from (select id,execution_time,host from jobs order by id desc limit 5) a group by a.host;
但是很明显,这将平均数限制为每个主机最近的5个工作,而不是最近的5个工作.
如果不使用某种存储过程,似乎很难使用LIMIT来限制平均值.这使我考虑使用MysqL变量为每个作业分配每个主机的完成顺序或职位.
这未经测试,但是它说明的理论应该是一个很好的起点:
首先,我们应该根据作业的主机为每个作业分配一个职位:
select
host,@current_pos := if (@current_host = host,@current_pos,0) + 1 as position,@current_host := host
from
(select @current_host := null,@current_pos := 0) set_pos,jobs
order by
host,id desc;
建立位置后,只需选择聚合函数,将结果限制在前5位:
select
jt.host,avg(jt.execution_time)
from
(
select
host,@current_host := host
from
(select @current_host := null,jobs
order by
host,id desc
) jt
where
jt.position <= 5
group
by host;
请让我知道这是否适合您,或者还有更多我未考虑的方面.这是一个有趣的问题.