我们有一个
postgresql数据库,每晚从一个cron作业备份,并带有以下命令:
su postgres -c "pg_dump our_database | gzip > /home/smb/shared/database_backup.bak.gz"
最近我们有一个磁盘故障,从一些坏扇区开始,在此期间pg_dump退出时出现以下错误
pg_dump: sql command Failed pg_dump: Error message from server: ERROR: catalog is missing 17 attribute(s) from relid 20158 pd_dump: The command was: LOCK TABLE public.obvez IN ACCESS SHARE MODE
现在,因为它是在cron作业,没有人注意到错误消息,备份被中断,但它不是零大小,一切似乎都没有,并且当我们意识到我们没有备份时,错误被忽视直到最终磁盘失败.
我们设法从较旧的备份恢复数据,但现在我想知道检查pg_dump是否成功完成其工作的正确方法是什么?
我将结果写入日志文件,在cronjob的末尾,我将日志文件的内容发送到我的电子邮件地址.那样的话,我会知道什么时候出错了.
su postgres "pg_dump our_database 2>> $LOG_FILE | gzip > /home/smb/shared/database_backup.bak.gz" cat $LOG_FILE | mailx $MAINTAINERS -s "Postgresql backup"
ADDENDUM:如果您只想在出现任何问题时发送电子邮件,可以查看pg_dump的返回码:
LOG_FILE=/tmp/pgdump.err if ! pg_dump -U backupuser "our_database" 2> $LOG_FILE then cat $LOG_FILE | mailx 'youremailaddress' -s "Postgresql backup failure!" fi