1.SELECT...GROUP BY的使用
Postgresql9.3官方文档:http://www.postgres.cn/docs/9.3/sql-select.html#SQL-GROUPBY
SELECT查询在通过了WHERE过滤器之后,生成的输出表可以继续用GROUP BY 子句进行分组,然后用HAVING子句删除一些分组行。
SELECTselect_list FROM... [WHERE...] GROUPBYgrouping_column_reference[,grouping_column_reference]... HAVINGcondition
GROUP BY 子句 用于把那些在表中所列出的列上共享相同值的行聚集在一起。 这些列的列出顺序并没有什么关系。 效果是把每组共享相同值的行缩减为一个组行,它代表该组里的所有行。 这样就可以删除输出里的重复和/或计算应用于这些组的聚集。 比如:
highgo=#createtabletests1(idintprimarykey,namevarchar,numint); highgo=#insertintotests1values(1,'yy',3),(2,'ws',2),(3,6); highgo=#select*fromtests1; id|name|num ----+------+----- 1|yy|3 2|ws|2 3|yy|6 (3行记录) highgo=#selectnamefromtests1groupbyname; name ------ ws yy (2行记录)
通常,如果一个表被分了组,那么没有在分组中引用的字段都不能引用,除了在聚集表达式中以外。 一个带聚集表达式的例子是:
highgo=#selectname,sum(num)fromtests1groupbyname; name|sum ------+----- ws|2 yy|9 (2行记录)
这里的 sum 是一个聚集函数,它在整个组上计算一个数值。 有关可用的聚集函数的更多信息可以在 Section 9.15 中找到。
注意: 没有聚集表达式的分组实际上计算了一个字段中独立数值的集合。 我们也可以用 DISTINCT 子句实现。
2.常用的聚合函数
Postgresql9.3中文文档:http://www.postgres.cn/docs/9.3/functions-aggregate.html
函数 | 参数类型 | 返回类型 | 描述 |
---|---|---|---|
avg(expression) |
smallint,int,bigint,real,double precision,numeric,or interval | 对于任何整数类型输入,结果都是numeric类型。 对于任何浮点输入,结果都是double precision类型。 否则和输入数据类型相同。 | 所有输入值的均值(算术平均) |
bit_and(expression) |
smallint,or bit | 和参数数据类型相同 | 所有非 NULL 输入值的按位与(AND),如果全部输入值皆为 NULL ,那么结果也为 NULL 。 |
bit_or(expression) |
smallint,or bit | 和参数数据类型相同 | 所有非 NULL 输入值的按位或(OR),如果全部输入值皆为 NULL ,那么结果也为 NULL 。 |
bool_and(expression) |
bool | bool | 如果所有输入值都是真,则为真,否则为假。 |
bool_or(expression) |
bool | bool | 如果至少有一个输入值为真,则为真,否则为假。 |
count(*) |
bigint | 输入行数 | |
count(expression) |
任意 | bigint | 计算所有输入行中满足expression不为 NULL 的行数。 |
every(expression) |
bool | bool | 等效于bool_and |
json_agg(record) |
record | json | 聚合记录作为JSON对象数组 |
max(expression) |
任意数组、数值、字符串、日期/时间类型 | 和参数数据类型相同 | 有输入行中expression的最大值 |
min(expression) |
任意数组、数值、字符串、日期/时间类型 | 和参数数据类型相同 | 所有输入行中expression的最小值 |
string_agg(expression,delimiter) |
(text,text) or (bytea,bytea) | 和参数数据类型相同 | 输入值连接成为一个字符串,用分隔符分开 |
sum(expression) |
smallint,or interval | 对于smallint或int输入,输出类型为bigint。 对于bigint输入,输出类型为numeric,对于浮点数输入, 输出类型为double precision。否则和输入数据类型相同。 | 所有输入行的expression总和。 |
3.HAVING子句的使用
如果一个表已经用GROUP BY子句分了组,然后你又只对其中的某些组感兴趣, 那么就可以用HAVING子句,它很象WHERE子句,用于删除一个分了组的表中的一些组。 语法是:
SELECTselect_listFROM...[WHERE...]GROUPBY...HAVINGboolean_expression
在 HAVING 子句中的表达式可以引用分组的表达式和未分组的表达式(后者必须涉及一个聚集函数)。
highgo=#selectname,sum(num)fromtests1groupbynamehavingsum(num)>5; name|sum ------+----- yy|9 (1行记录)
4.HAVING子句与WHERE子句的区别
HAVING去除了一些不满足条件的组行。它与WHERE 不同:WHERE在使用GROUP BY之前过滤出单独的行, 而HAVING过滤由GROUP BY创建的行。 在condition 里引用的每个字段都必须无歧义地引用一个分组的行,除非引用出现在一个聚合函数里。
HAVING的出现把查询变成一个分组的查询,即使没有GROUP BY 子句也这样。这一点和那些包含聚合函数但没有GROUP BY子句的查询里发生的事情是一样的。 所有选取的行都被认为会形成一个单一的组,而SELECT 列表和HAVING子句只能从聚合函数里面引用表的字段。 这样的查询在HAVING条件为真的时候将发出一个行,如果为非真,则返回零行。