\a
\C[字串]
\cd [目录名]
\copy...
\copyright
\d[名字]
\d{t|i|s|v|S}[模式]
\da[模式]
\dd[模式]
\dD[模式]
\df[模式]
\do[名字]
\dl
\dp[模式]
\dT[模式]
\du[模式]
\e[文件名]
\echo [字串]
\encoding[哪种编码]
\f[字串]
\g文件名
\h[名字]
\H
\i文件名
\l
\lo_export,\lo_import,\lo_list,\lo_unlink
\o文件名
\p
\pset 名字[值]
\q
\r
\s[文件名]
\set [名字[值]]
\t
\T[字串]
\timing
\unset名字
\w[文件名]
\x
\z[模式]
\![命令]
\echo [string]
命令:
\copy 表名 to 文件名|标准输出 [delimiter
解释:
delimiter as ‘分隔符’
null
csv quote as ‘引号类型’:说明导出的csv文件中的引号类型是什么,
对于Postgres7.4以前的版本,不支持csv的导入与导出,这时不要使用这个可选项。
例子:
aa=#\copy
这条命令将testtable表中的内容作为sql语句,导出data.csv文件中。
delimiter as ‘,’
csv quote as ‘”‘ :说明csv中的引号类型是“双引号”。
像前面说的:这个例子不适用在Postgres7.4以前的版本。
注意文件保存路径默认在:
C:\Documents andSettings\zhuyaopeng\目录下
命令:
\copy 表名 form 文件名|标准输入 [delimiter
例子:
aa=#\copy
这条命令将data.csv文件中的文本,作为sql语句导入到testtable表,
delimiter as ‘,’
csv quote as ‘”‘ :说明csv中的引号类型是“双引号”。
如果你只是要提取几行数据,并且你在执行查询中知道确切的行数,你可以使用LIMIT功能。如果有一个索引与 ORDER BY中的条件匹配,Postgresql可能就只处理要求的头几条记录,(否则将对整个查询进行处理直到生成需要的行)。如果在执行查询功能时不知道确切的记录数,可使用游标(cursor)和FETCH功能。
在psql中使用 \dt命令来显示数据表的定义,要了解psql中的完整命令列表可使用\?,另外,你也可以阅读 psql 的源代码文件pgsql/src/bin/psql/describe.c,它包括为生成psql反斜杠命令的输出的所有sql 命令。你还可以带 -E 选项启动 psql,这样它将打印出执行你在psql中所给出的命令的内部实际使用的SQL查询。Postgresql也提供了一个兼容sql的INFORMATIONSCHEMA接口, 你可以从这里获取关于数据库的信息。
在系统中有一些以pg_打头的系统表也描述了表的定义。
也可以浏览一下pgsql/src/tutorial/syscat.source文件,它列举了很多可从数据库系统表中获取信息的SELECT语法。
7.如何更改一个字段的数据类型?
在8.0版本里更改一个字段的数据类型很容易,可使用 ALTER TABLEALTER COLUMN TYPE 。
在以前的版本中,可以这样做:
你然后可以使用VACUUM FULL tab指令来使系统收回无效数据所占用的空间。
8.一行记录,一个表,一个库的最大尺寸是多少?
下面是一些限制:
一个数据库最大尺寸? 无限制(已存在有 32TB的数据库)
一个表的最大尺寸? 32 TB
一行记录的最大尺寸? 1.6 TB
一个字段的最大尺寸? 1 GB
一个表里最大行数? 无限制
一个表里最大列数? 250-1600 (与列类型有关)
一个表里的最大索引数量? 无限制
当然,实际上没有真正的无限制,还是要受可用磁盘空间、可用内存/交换区的制约。事实上,当这些数值变得异常地大时,系统性能也会受很大影响。
表的最大尺寸 32 TB不需要操作系统对大文件的支持。大表用多个 1 GB的文件存储,因此文件系统尺寸的限制是不重要的。
如果缺省的块大小增长到 32K,最大的表尺寸和最大列数还可以增加到四倍。
9.存储一个典型的文本文件里的数据需要多少磁盘空间?
一个 Postgres数据库(存储一个文本文件)所占用的空间最多可能需要相当于这个文本文件自身大小5倍的磁盘空间。
例如,假设有一个 100,000行的文件,每行有一个整数和一个文本描述。假设文本串的平均长度为20字节。文本文件占用 2.8 MB。存放这些数据的Postgresql 数据库文件大约是 6.4 MB:
索引不需要这么多的额外消耗,但也确实包括被索引的数据,因此它们也可能很大。
空值NULL存放在位图中,因此占用很少的空间。
并非每个查询都会自动使用索引。只有在表的大小超过一个最小值,并且查询只会选中表中较小比例的记录时才会采用索引。这是因为索引扫描引起的随即磁盘存取可能比直接地读取表(顺序扫描)更慢。
为了判断是否使用索引,Postgresql必须获得有关表的统计值。这些统计值可以使用VACUUM ANALYZE,或 ANALYZE 获得。使用统计值,优化器知道表中有多少行,就能够更好地判断是否利用索引。统计值对确定优化的连接顺序和连接方法也很有用。在表的内容发生变化时,应定期进行统计值的更新收集。
索引通常不用于 ORDER BY或执行连接。对一个大表的一次顺序扫描,再做一个显式的排序通常比索引扫描要快。
但是,在 LIMIT 和 ORDER BY结合使用时经常会使用索引,因为这只会返回表的一小部分。 实际上,虽然MAX() 和 MIN() 并不使用索引,通过对 ORDER BY 和 LLIMIT使用索引取得最大值和最小值也是可以的:
如果你确信Postgresql的优化器使用顺序扫描是不正确的,你可以使用SETenable_seqscan TO 'off'指令,然后再次运行查询,你就可以看出使用一个索引扫描是否确实要快一些。
当使用通配符操作,例如 LIKE 或 ~时,索引只能在特定的情况下使用:
字符串的开始部分必须是普通字符串,也就是说:
LIKE 模式不能以 % 打头。
~ (正则表达式)模式必须以 ^ 打头。
字符串不能以匹配多个字符的模式类打头,例如 [a-e]。
大小写无关的查找,如 ILIKE 和 ~* 等不使用索引,但可以用 4.8节描述的函数索引。
在做 initdb 时必须采用缺省的本地设置 Clocale,因为系统不可能知道在非C locale情况时下一个最大字符是什么。在这种情况下,你可以创建一个特殊的text_pattern_ops索引来用于LIKE的索引。
在8.0之前的版本中,除非要查询的数据类型和索引的数据类型相匹配,否则索引经常是未被用到,特别是对int2,int8和数值型的索引。
11.我怎样做正则表达式搜索和大小写无关的正则表达式查找?怎样利用索引进行大小写无关查找?
操作符 ~处理正则表达式匹配,而 ~*处理大小写无关的正则表达式匹配。大写些无关的 LIKE 变种成为ILIKE。
大小写无关的等式比较通常写做:
这样将不会使用标准的索引。但是可以创建一个可被利用的函数索引:
12.在一个查询里,我怎样检测一个字段是否为 NULL?我如何才能准确排序而不论某字段是否含 NULL值?
用 IS NULL 和 IS NOT NULL测试这个字段,具体方法如下:
为了能对含 NULL字段排序,可在 ORDER BY条件中使用 IS NULL和 IS NOT NULL 修饰符,条件为真 true将比条件为假false 排在前面,下面的例子就会将含 NULL的记录排在结果的上面部分:
13.各种字符类型之间有什么不同?
类型 内部名称 说明
VARCHAR(n) varchar指定了最大长度,变长字符串,不足定义长度的部分不补齐
CHAR(n) bpchar 定长字符串,实际数据不足定义长度时,以空格补齐
TEXT text 没有特别的上限限制(仅受行的最大长度限制)
BYTEA bytea 变长字节序列(使用NULL也是允许的)
"char" char 一个字符
上面所列的前四种类型是"varlena"(变长)类型(也就是说,开头的四个字节是长度,后面才是数据)。于是实际占用的空间比声明的大小要多一些。然而这些类型都可以被压缩存储,也可以用 TOAST脱机存储,因此磁盘空间也可能比预想的要少。
VARCHAR(n)在存储限制了最大长度的变长字符串是最好的。 TEXT 适用于存储最大可达1G左右但未定义限制长度的字符串。
CHAR(n) 最适合于存储长度相同的字符串。CHAR(n)会根据所给定的字段长度以空格补足(不足的字段内容), 而VARCHAR(n) 只存储所给定的数据内容。 BYTEA用于存储二进制数据,尤其是包含 NULL字节的值。这些类型具有相似的性能特性。
14.我如何获得一个插入的序列号的值?
一种方法是在插入之前先用函数 nextval()从序列对象里检索出下一个 SERIAL 值,然后再显式插入。使用 4.11.1里的例表,可用伪码这样描述:
这样还能在其他查询中使用存放在 new_id里的新值(例如,作为 person 表的外键)。 注意自动创建的 SEQUENCE对象的名称将会是 <table>_<serialcolumn>_seq, 这里table 和 serialcolumn 分别是你的表的名称和你的 SERIAL字段的名称。
类似的,在 SERIAL 对象缺省插入后你可以用函数currval() 检索刚赋值的 SERIAL 值,例如:
15.使用 currval()会导致和其他用户的冲突情况(racecondition)吗?
不会。currval()返回的是你本次会话进程所赋的值而不是所有用户的当前值。
16.为什么不在事务异常中止后重用序列号呢?为什么在序列号字段的取值中存在间断呢?
为了提高并发性,序列号在需要的时候赋予正在运行的事务,并且在事务结束之前不进行锁定,这就会导致异常中止的事务后,序列号会出现间隔。
17.什么是 OID?什么是 CTID ?
Postgresql里创建的每一行记录都会获得一个唯一的OID,除非在创建表时使用WITHOUTOIDS选项。 OID创建时会自动生成一个4字节的整数,所有 OID 在整个Postgresql 中均是唯一的。 然而,它在超过40亿时将溢出,OID此后会出现重复。Postgresql 在它的内部系统表里使用 OID在表之间建立联系。
在用户的数据表中,最好是使用SERIAl来代替OID因为SERIAL只是保证在单个表中数据是唯一的,这样它溢出的可能性就非常小了,SERIAL8可用来保存8字节的序列号字段。
CTID用于标识带着数据块(地址)和(块内)偏移的特定的物理行。 CTID在记录被更改或重载后发生改变。索引入口使用它们指向物理行。
18.为什么我收到错误信息“ERROR: Memoryexhausted in AllocSetAlloc()”?
这很可能是系统的虚拟内存用光了,或者内核对某些资源有较低的限制值。在启动postmaster 之前试试下面的命令:
取决于你用的shell,上面命令只有一条能成功,但是它将把你的进程数据段限制设得比较高,因而也许能让查询完成。这条命令应用于当前进程,以及所有在这条命令运行后创建的子进程。如果你是在运行sql客户端时因为后台返回了太多的数据而出现问题,请在运行客户端之前执行上述命令。
19.怎样进行 outer join(外连接)?
Postgresql 采用标准的 sql语法支持外连接。这里是两个例子:
或是
这两个等价的查询在 t1.col 和 t2.col上做连接,并且返回 t1 中所有未连接的行(那些在 t2中没有匹配的行)。 右[外]连接(RIGHT OUTER JOIN)将返回 t2中未连接的行。 完全外连接(FULL OUTER JOIN)将返回 t1 和 t2中未连接的行。 关键字 OUTER在左[外]连接、右[外]连接和完全[外]连接中是可选的,普通连接被称为内连接(INNERJOIN)。
没有办法查询当前数据库之外的数据库。 因为 Postgresql要加载与数据库相关的系统目录(系统表),因此跨数据库的查询如何执行是不定的。
附加增值模块contrib/dblink允许采用函数调用实现跨库查询。当然用户也可以同时连接到不同的数据库执行查询然后在客户端合并结果。
21.如何让函数返回多行或多列?
在函数中返回数据记录集的功能是很容易使用的,详情参见:http://techdocs.postgresql.org/guides/SetReturningFunctions
22.为什么我在使用PL/Pgsql函数存取临时表时会收到错误信息“relationwith OID ##### does not exist”?
PL/Pgsql会缓存函数的内容,由此带来的一个不好的副作用是若一个PL/Pgsql函数访问了一个临时表,然后该表被删除并重建了,则再次调用该函数将失败,因为缓存的函数内容仍然指向旧的临时表。解决的方法是在 PL/Pgsql中用EXECUTE对临时表进行访问。这样会保证查询在执行前总会被重新解析。