环境: Postgres 9.1.2
评论表T1(user_id reference T2(user_id))
用户表T2(user_id)
场景:
需要对T1表中数据按评论数分组排序,选择前5条记录与表T2进行关联,返回满足条件的T2用户数据,但要根据T1的排序结果来展示,也就是要显示评论最多的5个用户的详细信息,并按评论数把用户从高到低排列。
开发的sql:
1.查看表T1,并排序
select user_id,count(1) from t1 group by user_id order by count(1) desc limit 5;2.与表T2关联
select * from t2 where user_id in( select user_id from t1 group by user_id order by count(1) desc limit 5);但是展示的T2结果虽然取出来了,但并没有排序,没有达到效果
解决办法: 1.使用两个表的join来实现
select t2.user_id,t2.user_name,count(1) as num from t1,t2 where t1.user_id = t2.user_id group by t2.user_id,t2.user_name order by num desc limit 5;2.用with来构造:
with tmp as( select user_id,count(1) as num from t1 group by user_id order by num desc limit 5 ) select t2.*,tmp.num from t2 inner join tmp on t2.user_id = tmp.user_id order by tmp.num desc
分析:
第一种办法需要两张表关联再分组取前5条,执行计划如下:
如果数据量比较大,尤其是T2表很大的时候,会消耗比较多的资源,另外如果想取用户表里有其他的字段,也需要进行分组
第二种办法是采用with来构造临时表,然后再去与T2表关联取数,执行计划如下:
可以看到消耗的资源相对少一点,测试中发现T2、T1表很大的时候,这种差距尤其明显。