IT程序员开发必备-各类资源下载清单,史上最全IT资源,个人收藏总结!
单字段索引:
CREATE INDEX index_name ON table_name (field1);
联合索引:
CREATE INDEX index_name ON table_name (field1,field2);
MysqL的联合索引的使用,在select里的where条件是要求有序的,比如where field1=100和where field1=100 and field2=1000都可以利用到上面这个组合索引(多条件尽量不要用or,至少用
UNION代替OR
),但使用where field2=1000或where field2=1000 and field1=100就利用不到索引了。
条件(部分)索引:
CREATE INDEX index_name ON table_name (field1) WHERE field1 > 100;
注意:想要使用条件索引,在使用select语句时,where条件最好加上field>100(最少100)的条件,否则索引很可能利用不到。
postgre里看索引是否利用情况跟MysqL中一样,但返回信息的格式差别巨大。
看查询规则使用:
EXPLAIN
1、没对字段field1建索引前:
EXPLAIN SELECT * FROM table_name WHERE field1 = 1000; QUERY PLAN ------------------------------------------------------------ Seq Scan on table_name (cost=0.00..393.00 rows=6243 width=345) Filter: (field1 = 1000)
cost里面的是些postgre的预估时间等,关键看红色部分,filter表示全表扫描。
2、对field建索引后:
EXPLAIN SELECT * FROM table_name WHERE field1 = 1000; QUERY PLAN ------------------------------------------------------------
Index Scan using index_name on table_name (cost=0.00..10.00 rows=1 width=243) Index Cond: (field1 = 1000)
这次,利用到了索引。
当然,利用EXPLAIN至少postgre规则器的预估值,要看准确值可以利用ANALYZE.
如:
EXPLAIN ANALYZE SELECT * FROM table_name WHERE field1 = 1000; QUERY PLAN ------------------------------------------------------------
Index Scan using index_name on table_name (cost=0.00..10.00 rows=1 width=243)(actual time=0.025..0.053 rows=1 loops=1) Index Cond: (field1 = 1000)
actual部分就是真实执行所用的开销。
PostgreSQL查询时使用了查询规则器,这也导致一些意料之外的情况,比如索引利用不到(查询规则器自以为是的帮你“优化”了查询方式,导致利用不了结果)。如:
EXPLAIN SELECT * FROM table_name WHERE field1 > 1000; QUERY PLAN ------------------------------------------------------------ Seq Scan on table_name (cost=0.00..393.00 rows=62430 width=345) Filter: (field1 > 1000)
当field1>1000的结果集很多,或者postgre的查询规则器认为很多,它会觉得直接使用filter会更合理,就会使索引白建了,这方面要引起注意。
另外一类情况在使用order by子句时,postgre往往会多做一些额外的sort(在建立了多字段索引的情况下),如(下面内容引用自参考文献):
CREATE INDEX mytable_categoryid_userid_
ctime
ON mytable (category_id,user_id,ctime);
EXPLAIN SELECT * FROM mytable
WHERE category_id=1 AND user_id=2
ORDER BY
DESC; NOTICE:QUERY PLAN: Sort(cost=2.03..2.03 rows=1 width=16) ->Index Scanusing mytable_categoryid_userid_ctime
onmytable(cost=0.00..2.02 rows=1 width=16)
数据库多做了一个没有要求的排序。
为了跳过排序这一步,并不需要其它另外的索引,只要将查询语句稍微改一下。这里用的是postgres,将给该数据库一个额外的提示--在ORDERBY语句中,加入where语句中的字段。这只是一个技术上的处理,并不是必须的,因为实际上在另外两个字段上,并不会有任何的排序操作,不过如果加入,postgres将会知道哪些是它应该做的。
EXPLAIN SELECT * FROM mytable WHERE category_id=1 AND user_id=2 ORDER BY category_id DESC,user_id DESC,
ctime
DESC; NOTICE:QUERY PLAN: Index Scan Backward using mytable_categoryid_userid_add daon my table
(cost=0.00..2.02 rows=1 width=16)
这就避免了不必要的sort了。
注意:上面提到的联合索引、多字段索引、组合索引指的是同一个东西。
还有,MysqL中可以利用select sql_CACHE/sql_NO_CACHE * from table_name来让MysqL利用或不利用查询缓存。在postgresql中貌似没这种概念,也就没有对应关键字。
参考:
http://www.perfgeeks.com/?p=460 (主要是将MysqL索引的,讲的很好)
http://www.kuqin.com/postgreSQL8.1_doc/performance-tips.html
http://baike.baidu.com/view/2079871.htm