Postgresql提供了一些帮助提升性能的功能。主要有一些几个方面。 |
1.使用EXPLAIN |
EXPLAIN命令可以查看执行计划,在前面的blog中已经介绍过。这个方法是我们最主要的调试工具。 |
|
2.及时更新执行计划中使用的统计信息 |
@H_301_37@
由于统计信息不是每次操作数据库都进行更新的,一般是在VACUUM、ANALYZE、CREATEINDEX等DDL执行的时候会更新统计信息, |
因此执行计划所用的统计信息很有可能比较旧。这样执行计划的分析结果可能误差会变大。 |
|
以下是表tenk1的相关的一部分统计信息。 |
@H_301_37@
SELECT relname,relkind,reltuples,relpages |
@H_301_37@
FROMpg_class |
@H_301_37@
WHERE relnameLIKE 'tenk1%'; |
|
@H_301_37@
relname | relkind | reltuples |relpages |
@H_301_37@
----------------------+---------+-----------+---------- |
@H_301_37@
tenk1 |r|10000|358 |
@H_301_37@
tenk1_hundred|i|10000|30 |
@H_301_37@
tenk1_thous_tenthous|i|10000|30 |
@H_301_37@
tenk1_unique1 |i|10000|30 |
@H_301_37@
tenk1_unique2 |i|10000|30 |
@H_301_37@
(5 rows) |
@H_301_37@
其中relkind是类型,r是自身表,i是索引index;reltuples是项目数;relpages是所占硬盘的块数。 |
|
@H_301_37@
3.明确用join来关联表 |
@H_301_37@
一般写法:SELECT * FROM a,b,cWHERE a.id = b.id AND b.ref = c.id; |
@H_301_37@
如果明确用join的话,执行时候执行计划相对容易控制一些。 |
@H_301_37@
例子: |
@H_301_37@
SELECT * FROM a CROSS JOIN bCROSS JOIN c WHERE a.id = b.id AND b.ref = c.id; |
@H_301_37@
SELECT * FROM a JOIN (b JOINc ON (b.ref = c.id)) ON (a.id = b.id); |
|
@H_301_37@
4.关闭自动提交(autocommit=false) |
|
@H_301_37@
5.多次插入数据是用copy命令更有效率 |
@H_301_37@
我们有的处理中要对同一张表执行很多次insert操作。这个时候我们用copy命令更有效率。因为insert一次,其相关的index都要做一次,比较花费时间。 |
|
@H_301_37@
6.临时删除index |
@H_301_37@
有时候我们在备份和重新导入数据的时候,如果数据量很大的话,要很几个小时才能完成。这个时候可以先把index删除掉。导入在建index。 |
|
@H_301_37@
7.外键关联的删除 |
@H_301_37@
如果表的有外键的话,每次操作都没去check外键整合性。因此比较慢。数据导入后在建立外键也是一种选择。 |
|
@H_301_37@
8.增加maintenance_work_mem参数大小 |
@H_301_37@
增加这个参数可以提升CREATE INDEX和ALTERTABLE ADD FOREIGN KEY的执行效率。 |
|
@H_301_37@
9.增加checkpoint_segments参数的大小 |
@H_301_37@
增加这个参数可以提升大量数据导入时候的速度。 |
|
@H_301_37@
10.设置archive_mode无效 |
@H_301_37@
这个参数设置为无效的时候,能够提升以下的操作的速度 |
@H_301_37@
?CREATE TABLE AS SELECT |
@H_301_37@
?CREATE INDEX |
@H_301_37@
?ALTER TABLE SETTABLESPACE |
@H_301_37@
?CLUSTER等。 |
|
@H_301_37@
11.最后执行VACUUM ANALYZE |
@H_301_37@
表中数据大量变化的时候建议执行VACUUMANALYZE。 |