为什么Postgresql数据库管理工作中,定期vacuum是一个重要的工作.
原因在于以下3点:
第一点的原因是Postgresql数据的插入,更新,删除操作并不是真正放到数据库空间.如果不定期释放空间的话,由于数据太多,查询速度会巨降.
第二点的原因是Postgresql在做查询处理的时候,为了是查询速度提高,会根据统计数据来确定执行计划.如果不及时更新的话,查询的效果可能不如预期.
第三点的原因是Postgresql中每一个事务都会产生一个事务ID,但这个数字是有上限的. 当事务ID达到最大值后,会重新从最小值开始循环.这样如果不及时把以前的数据释放掉的话,原来的老数据会因为事务ID的丢失而丢失掉.
话说回来vacuum操作可以手动和自动.如果有专门的数据库维护人员的话,可以适时进行.但很多系统为了节省维护成本,这样就需要依赖自动vacuum了.
虽说定期vacuum是Postgresql的一个弱点,不过在8.3版本以后,把这个任务交给自动vacuum就可以了.
要使自动vacuum有效,必须设置track_counts参数为true.具体的设置可以参照官方的文档.
定期vacuum还是自己写一个shell来自动执行比较好.
在shell中执行vacuumdb命令. 例: ./vacuumdb -d databaseName --analyze
crontab中设置执行这个shell的用户为数据库超级用户,然在在这个超级用户的home下面建一个.pgpass认证文件,就可以定期执行batch了.