http://huangro.javaeye.com/blog/366038
pg_dump是一个将Postgresql数据库保存到一个脚本或者归档文件中的工具.这个脚本文件的格式是纯文本,它包含许多sql命令, 这些sql命令可以用于重建该数据库并将之恢复到保存成脚本的时候的状态.要恢复这些脚本,使用psql。 它们甚至可以用于在其它机器甚至是其它硬件体系的机器上 重建该数据库,通过对脚本进行一些修改,甚至可以在其它sql数据库产品 上重建该数据库. 另外,还有候选的归档文件格式可以和pg_restore一起使用重建数据库, 并且它们也允许pg_restore对恢复什么东西进行选择,或者甚至是在恢复之前对需要恢复的条目进行重新排序. 归档文件也是设计成可以跨平台移植的.pg_dump将保存用于重建所有用户定义的类型,函数,表,索引聚集和操作符所必须的信息.另外, 所有数据是用文本格式拷贝出来的,因而也可以很容易地拷贝回去, 也很容易用工具编辑. 如 果一种候选文件格式和pg_restore结合,那么pg_dump就能提供一种灵活的归档和传输机制.pg_dump可以用于备份整个数据库, 然后就可以使用pg_restore检查 这个归档和/或选择要恢复的数据库部分. 最灵活等输出文件格式是"custom(客户化)"格式(-Fc).
它允许对归档元素进行选取和重新排列,并且缺省时是压缩的.tar格式(-Ft)不是压缩的并且我们在装载等时候不可能重排列,不过它也很灵活;还有,它可以用其它工具,比如tar处理. 在运行pg_dump的时候,我们应该检查 输出,看看是否有任何警告存在(在标准错误上打印), 特别是下面列出的限制. 即使数据库在并行使用着的时候,pg_dump也制作出连贯的备份.pg_dump并不阻塞其它 用户对数据库的访问(读或写). 选项下面的命令行参数用于控制输出格式。
dbname声明将要转储的数据库名. 如果没有声明这个参数,那么使用环境变量PGDATABASE。 如果那个环境变量也没声明,那么用发起连接的用户名。
-a --data-only只输出数据,不输出结构(表定义). 这个选项只是对纯文本格式有意义.对于其它格式,你可以在调用pg_restore的时候声明选项.
-b --blobs转储数据和BLOB数据.
-c --clean输出在创建数据库创建命令之前先清理(删除)该数据库对象的命令.这个选项只是对纯文本格式有意义.对于其它格式,你可以在调用pg_restore的时候声明选项.
-C --create以一条创建该数据库本身并且与这个数据库联接等命令开头进行输出.(如果是这种形式的脚本,那么你在运行脚本之前和哪个数据库联接就不重要了.)这个选项只对纯文本格式有意义.对于其它格式,你可以在调用pg_restore的时候声明该选项.
-d --inserts将数据输出为的INSERT命令(而不是COPY). 这样会导致恢复非常缓慢.但却令归档更容易移植到其它sql数据库.
-D --column-inserts --attribute-inserts把数据转储为带有明确字段名的INSERT命令. 这样会导致恢复非常缓慢, 但是如果你想重新排列字段的顺序,那么它是必须的.
-f file --file=file把输出发往指定的文件.如果忽略这些,则使用标准输出.-F format --format=format选择输出的格式.format可以是下列之一:p输出纯文本sql脚本文件(缺省)t输出适合输入到pg_restore里的tar归档文件.使用这个归档允许在恢复数据库时重新排序和/或把表结构排除在外. 同时也可能可以在恢复的时候限制对哪些数据进行恢复.c输出适于给pg_restore用的客户化归档. 这是最灵活的格式,它允许对装载的数据和纲要元素进行重新排列.这个格式缺省的时候是压缩的.
-i --ignore-version忽略在pg_dump和数据库服务器之间的版本差别.pg_dump可以处理来自以前版本的Postgresql的数据库,但是太老的版本则不被支持了(目前是支持到7.0)。 如果你需要跨越版本检查时才使用这个选项( 而且如pg_dump失效,别说我没警告你).
-o --oids为每个表都输出对象标识(OID). 如果你的应用在某种程度上引用了OID字段的话,(比如,在外键约束中 用到). 那么使用这个选项. 否则,不应该使用这个选项.
-O --no-owner不 把对象的所有权设置为对应源数据库. 通常,pg_dump发出(psql特有的) \connect语句以设置纲要元素的所有权. 又见-R和-X use-set-session-authorization选项. 请注意-O并不防止所有对数据库的重新联接,只是防止那些为调整权限进行的排它联接. 这个选项只是对纯文本格式有意义.对于其它格式,在你调用pg_restore的时候你可以声明该选项.
-R --no-reconnect禁止pg_dump发出任何\connect语句. 在 纯文本输出模式下,禁止pg_dump输出那种需要在恢复数据库的过程中重新联接数据库的脚本.一般的恢复脚本通常需要以不同的用户与服务器联接多次以设置 该对象最初的所有权.这个选项是一个相当粗糙的指令,因为 它令pg_dump失去了这个权限信息, 除非你使用-X use-set-session-authorization选项.我们不想在恢复的过程中重新联接的一个可能原因是也许对 数据库的访问需要手工干涉(也就是说,口令). 这个选项只是对纯文本格式有意义.对于其它格式, 你在调用pg_restore的时候可以声明选项.
-s --schema-only只输出表纲要(定义),不输出数据.
-S username --superuser=username在某些场合,pg_dump创建的脚本或者归档需要有 超级用户访问的权限,比如在关闭触发器或者为大纲元素甚至所有属性时. 这个选项声明在这些场合时使用的用户名.
-t table --table=table只输出表table的数据.
-v --verbose声明冗余模式。 这样将令pg_dump在标准错误上打印 进度信息。-x --no-privileges --no-acl避免输出ACL(赋予/撤消 命令)和表的所有者关系信息.
-X use-set-session-authorization --use-set-session-authorization通 常,如果一个pg_dump生成的(纯文本模式)脚本 必须更改当前的数据库用户(比如,设置正确的对象所有权)的时候, 它使用psql \connect命令. 这条命令实际上打开一个新的联接,这个时候可能需要收工干涉(比如,输入口令).如果你使用-X use-set-session-authorization,那么pg_dump则会输出SET SESSION AUTHORIZATION命令.这么做效果相同, 但是它要求使用生成的脚本做数据库恢复的用户是数据库超级用户.这个选项有效地覆盖了-R选项. 因为SET SESSION AUTHORIZATION是一个 标准的sql命令,而\connect只能用于psql,因此这个选项同时还在理论上增加 了输出脚本的可移植性. 这个选项只对纯文本格式有意义.对于其它格式,你可以在你调用pg_restore的时候声明该选项.
-Z 0..9 --compress=0..9声明在那些支持压缩的格式中使用的压缩级别. (目前只有客户化格式支持压缩). 下面的命令行参数控制数据库为联接参数。
-h host --host=host声明运行服务器 的机器的主机名.缺省是使用本地Unix主控套接字,而不是一个IP联接. 如果主机名以斜扛开头,则它被用做到Unix域套接字的路径.
-p port --port=port声明服务器 正在侦听并等待联接的TCP/IP端口或本地Unix主控套接字文件句柄. 缺省的端口号是5432,或者环境变量PGPORT的值(如果存在).
-U username以给出用户身分联接.
-W强制口令提示.如果服务器需要口令认证,那么这个动作应该自动发生. 只有在一些平台上才有长选项形式。
环境PGDATABASE PGHOST PGPORT PGUSER缺省连接参数 诊断Connection to database 'template1' Failed. connectDBStart() -- connect() Failed: No such file or directory Is the postmaster running locally and accepting connections on Unix socket '/tmp/.s.PGsql.5432'? pg_dump无法与指定主机和端口上的Postgresql服务器 相联.如果看到这条信息,确认 服务器 正在给定的主机上你所声明的端口上运行.
dumpSequence(table): SELECT Failed你没有读取数据库的权限. 和你的Postgresql节点管理员联系. 注意: pg_dump在内部使用SELECT语句.如果你运行pg_dump时碰到问题,确认你能够使用象psql这样的程序从数据 库选择. 注意如 果你的安装给template1数据库增加了任何你自己的东西,那么请注意把pg_dump的输出恢复到一个 真正空的数据库中;否则你可能会收到因为重复定义所追加的对象 而造成的错误信息.要制作一个没有任何本地附属物的数据库,可以从template0而不是template1拷贝,比如∶ CREATE DATABASE foo WITH TEMPLATE template0;
pg_dump有几个限制∶在转储一个表或者作为纯文本转储时,pg_dump无法操作 大对象.大对象必须整体地使用二进制归档格式中的一种进行转储. 在进行纯数据转储时,pg_dump发出一些查询先关闭在用户 表上面的触发器,然后插入数据,数据插入完成后再发出查询打开触发器. 如果恢复动作在中间停止,那么系统表可能就会处于一种错误状态.tar归档的成员的大小限制于8 GB。(这个限制是tar文件格式 的固有限制。)因此这个格式无法用于那些一个表的大小超过这个 尺寸的原文表现。tar归档和任何其它输出格式的总大小是不受 限制的,只是可能会又操作系统的限制。
例子
转储一个数据库∶ $ pg_dump mydb > db.out
重载这个数据库∶ $ psql -d database -f db.out
输出一个叫mydb的包含BLOB的数据库到一个tar文件:$ pg_dump -Ft -b mydb > db.tar
把这个数据库(连同BLOB) 一起恢复到一个现有的叫newdb的数据库:$ pg_restore -d newdb db.tar
历史pg_dump工具最早出现在Postgres95版本0.02. 非纯文本输出格式在Postgresql版本7.1时引入.