1.什么是索引?@H_403_6@ 索引是建立在表的一列或多个列上的辅助对象,目的是加快访问表中的数据;@H_403_6@ Oracle存储索引的数据结构是B*树(平衡树),位图索引也是如此,只不过是叶子节点不同B*数索引;@H_403_6@ 索引由根节点、分支节点和叶子节点组成,上级索引块包含下级索引块的索引数据,叶节点包含索引数据和确定行实际位置的rowid。@H_403_6@ 2.使用索引的目的:@H_403_6@ 加快查询速度@H_403_6@ 减少I/O操作@H_403_6@ 消除磁盘排序(索引能加快排序速度)@H_502_36@
@H_403_6@ 3.何时使用索引:@H_403_6@ 查询返回的记录数 排序表<40% ,对非排序表<7%@H_403_6@ 表的碎片较多(频繁增加、删除)@H_403_6@ @H_403_6@ 4.索引的种类@H_403_6@ 非唯一索引(最常用)@H_403_6@ 唯一索引@H_403_6@ 位图索引@H_403_6@ 局部有前缀分区索引@H_403_6@ 局部无前缀分区索引@H_403_6@ 全局有前缀分区索引@H_403_6@ 散列分区索引@H_403_6@ 基于函数的索引@H_502_36@
@H_403_6@ 5.管理索引的准则@H_403_6@ 在表中插入数据后创建索引@H_403_6@ 在用sql*Loader或import工具插入或装载数据后,建立索引比较有效;@H_403_6@ @H_502_36@
6.索引正确的表和列@H_403_6@ 经常检索排序大表中40%或非排序表7%的行,建议建索引;@H_403_6@ 。为了改善多表关联,索引列用于联结;@H_403_6@ 。列中的值相对比较唯一;@H_403_6@ 。取值范围(大:B*树索引,小:位图索引);@H_403_6@ 。Date型列一般适合基于函数的索引;@H_403_6@ 。列中有许多空值,不适合建立索引@H_403_6@ @H_403_6@ 7.为性能而安排索引列@H_403_6@ @H_403_6@ 。经常一起使用多个字段检索记录,组合索引比单索引更有效;@H_403_6@ 。把最常用的列放在最前面,例:dx_groupid_serv_id(groupid,serv_id),在where条件中使用groupid或groupid,serv_id,查询将使用索引,若仅用到serv_id字段,则索引无效;@H_403_6@ 3.3合并/拆分不必要的索引。@H_403_6@ @H_403_6@ 3.4限制每个表索引的数量@H_403_6@ @H_403_6@ 。一个表可以有几百个索引(你会这样做吗?),但是对于频繁插入和更新表,索引越多系统cpu,I/O负担就越重;@H_403_6@ 。建议每张表不超过5个索引。@H_403_6@ @H_403_6@ 3.5删除不再需要的索引@H_403_6@ @H_403_6@ 。索引无效,集中表现在该使用基于函数的索引或位图索引,而使用了B*树索引;@H_403_6@ 。应用中的查询不使用索引;@H_403_6@ 。重建索引之前必须先删除索引,若用alterindex…rebuild重建索引,则不必删除索引。@H_403_6@ @H_403_6@ 3.6索引数据块空间使用@H_403_6@ 。创建索引时指定表空间,特别是在建立主键时,应明确指定表空间;@H_403_6@ 。合理设定pctfress,注意:不能给索引指定pctused;@H_403_6@ 。估计索引的大小和合理地设置存储参数,默认为表空间大小,或initial与next设置成一样大。@H_403_6@ 3.7考虑并行创建索引@H_403_6@ 。对大表可以采用并行创建索引,在并行创建索引时,存储参数被每个查询服务器进程分别使用,例如:initial为1M,并行度为8,则创建索引期间至少要消耗8M空间;@H_403_6@ 3.8考虑用nologging创建索引@H_403_6@ 。对大表创建索引可以使用nologging来减少重做日志;@H_403_6@ 。节省重做日志文件的空间;@H_403_6@ 。缩短创建索引的时间;@H_403_6@ 。改善了并行创建大索引时的性能。@H_403_6@ @H_502_36@
8.怎样建立最佳索引?@H_403_6@ @H_403_6@ 明确地创建索引@H_403_6@ createindexindex_nameontable_name(field_name)@H_403_6@ tablespacetablespace_name@H_403_6@ pctfree5@H_403_6@ initrans2@H_403_6@ maxtrans255@H_403_6@ storage@H_403_6@ (@H_403_6@ minextents1@H_403_6@ maxextents16382@H_403_6@ pctincrease0@H_403_6@ );@H_403_6@ @H_403_6@ 创建基于函数的索引:@H_403_6@ 常用与UPPER、LOWER、TO_CHAR(date)等函数分类上,例:@H_403_6@ createindexidx_funconemp(UPPER(ename))tablespacetablespace_name;@H_403_6@ @H_403_6@ 创建位图索引:@H_403_6@ 对基数较小,且基数相对稳定的列建立索引时,首先应该考虑位图索引,例:@H_403_6@ createbitmapindexidx_bitmonclass(classno)tablespacetablespace_name;@H_403_6@ @H_403_6@ 明确地创建唯一索引@H_403_6@ 可以用createuniqueindex语句来创建唯一索引,例:@H_403_6@ createuniqueindexdept_unique_idxondept(dept_no)tablespaceidx_1;@H_403_6@ @H_403_6@ 创建与约束相关的索引@H_403_6@ @H_403_6@ 。可以用usingindex字句,为与unique和primarykey约束相关的字段创建索引,例如:@H_403_6@ altertabletable_name@H_403_6@ addconstraintPK_primary_keynameprimarykey(field_name)@H_403_6@ usingindextablespacetablespace_name;@H_403_6@ @H_403_6@ 5.如何创建局部分区索引@H_403_6@ @H_403_6@ 。基础表必须是分区表;@H_403_6@ 。分区数量与基础表相同;@H_403_6@ 。每个索引分区的子分区数量与相应的基础表分区相同;@H_403_6@ 。基础表的子分区中的行的索引项,被存储在该索引的相应的子分区中,例如:@H_403_6@ CreateIndexTG_CDR04_SERV_ID_IDXOnTG_CDR04(SERV_ID)@H_403_6@ Pctfree5@H_403_6@ TablespaceTBS_AK01_IDX@H_403_6@ Storage(@H_403_6@ MaxExtents32768@H_403_6@ PctIncrease0@H_403_6@ FreeLists1@H_403_6@ FreeListGroups1@H_403_6@ )@H_403_6@ local@H_403_6@ /@H_403_6@ @H_403_6@ 6如何创建范围分区的全局索引@H_403_6@ @H_403_6@ 。基础表可以是全局表和分区表。@H_403_6@ createindexidx_start_dateontg_cdr01(start_date)@H_403_6@ globalpartitionbyrange(start_date)@H_403_6@ (partitionp01_idxvlaueslessthan(‘0106’)@H_403_6@ partitionp01_idxvlaueslessthan(‘0111’)@H_403_6@ …@H_403_6@ partitionp01_idxvlaueslessthan(‘0401’))@H_403_6@ /@H_403_6@ 重建现存的索引@H_403_6@ 重建现存的索引的当前时刻不会影响查询;@H_403_6@ @H_403_6@ 重建索引可以删除额外的数据块;@H_403_6@ 提高索引查询效率;@H_403_6@ alterindexidx_namerebuildnologging;@H_403_6@ @H_403_6@ 对于分区索引:@H_403_6@ alterindexidx_namerebuildpartitionpartiton_namenologging;@H_403_6@ @H_403_6@ 7.要删除索引的原因@H_403_6@ @H_403_6@ 。不再需要的索引;@H_403_6@ 。索引没有针对其相关的表所发布的查询提供所期望的性能改善;@H_403_6@ 。应用没有用该索引来查询数据;@H_403_6@ 。该索引无效,必须在重建之前删除该索引;@H_403_6@ 。该索引已经变的太碎了,必须在重建之前删除该索引;@H_403_6@ 。语句:dropindexidx_name;dropindexidx_namedroppartitionpartition_name;@H_403_6@ @H_403_6@ 8.建立索引的代价@H_403_6@ @H_403_6@ 基础表维护时,系统要同时维护索引,不合理的索引将严重影响系统资源,主要表现在cpu和I/O上;@H_403_6@ @H_403_6@ 插入、更新、删除数据产生大量dbfilesequentialread锁等待;@H_502_36@
一个表中有几百万条数据,对某个字段加了索引,但是查询时性能并没有什么提高,这主要可能是oracle的索引限制造成的。@H_502_36@
oracle的索引有一些索引限制,在这些索引限制发生的情况下,即使已经加了索引,oracle还是会执行一次全表扫描,查询的性能不会比不加索引有所提高,反而可能由于数据库维护索引的系统开销造成性能更差。@H_502_36@
常见的索引限制问题:@H_502_36@
9、使用不等于操作符(<>,!=)@H_502_36@
下面这种情况,即使在列dept_id有一个索引,查询语句仍然执行一次全表扫描@H_502_36@
select * from dept where staff_num <> 1000;@H_502_36@
但是开发中的确需要这样的查询,难道没有解决问题的办法了吗?@H_502_36@
有!@H_502_36@
通过把用 or语法替代不等号进行查询,就可以使用索引,以避免全表扫描:上面的语句改成下面这样的,就可以使用索引了。@H_502_36@
select * from dept shere staff_num < 1000 or dept_id > 1000;@H_502_36@
10、使用 is null或 is not null@H_502_36@
使用is null或is nuo null也会限制索引的使用,因为数据库并没有定义null值。如果被索引的列中有很多null,就不会使用这个索引(除非索引是一个位图索引,关于位图索引,会在以后的blog文章里做详细解释)。在sql语句中使用null会造成很多麻烦。@H_502_36@
解决这个问题的办法就是:建表时把需要索引的列定义为非空(not null)@H_502_36@
如果没有使用基于函数的索引,那么where子句中对存在索引的列使用函数时,会使优化器忽略掉这些索引。下面的查询就不会使用索引:@H_502_36@
select * from staff where trunc(birthdate) = '01-MAY-82';@H_502_36@
但是把函数应用在条件上,索引是可以生效的,把上面的语句改成下面的语句,就可以通过索引进行查找。@H_502_36@
select * from staff where birthdate < (to_date('01-MAY-82') + 0.9999);@H_502_36@
12、比较不匹配的数据类型@H_502_36@
比较不匹配的数据类型也是难于发现的性能问题之一。下面的例子中,dept_id是一个varchar2型的字段,在这个字段上有索引,但是下面的语句会执行全表扫描。@H_502_36@
select * from dept where dept_id = 900198;@H_502_36@
这是因为oracle会自动把where子句转换成to_number(dept_id)=900198,就是3所说的情况,这样就限制了索引的使用。把sql语句改为如下形式就可以使用索引@H_502_36@
select * from dept where dept_id = '900198';@H_502_36@
13、使用like子句@H_502_36@
使用like子句查询时,数据需要把所有的记录都遍历来进行判断,索引不能发挥作用,这种情况也要尽量避免。@H_502_36@
Like的字符串中第一个字符如果是‘%’则用不到索引@H_403_6@ Column1 like ‘aaa%’是可以的@H_403_6@ Column1 like ‘%aaa%’用不到@H_502_36@
14.使用IN@H_502_36@
尽管In
写法要比exists简单一些,exists一般来说性能要比In要高的多
用In还是用Exists的时机
当in的集合比较小的时候,或者用Exists无法用到选择性高的索引的时候,用In要好,否则就要用
Exists@H_403_6@ 例:
select count(*) from person_info where xb in (select xb_id from dic_sex);@H_403_6@ Select count(*) from n_acntbasic a where shbxdjm =:a and exists(select 1 from person_info where pid=a.pid and …);@H_403_6@ @H_403_6@ Select * from person_info where zjhm=3101….;将会对person_info全表扫描
Select * from person_info where zjhm =‘3101…’
才能用到索引
假定TEST表的dt字段是date类型的并且对dt建了索引。
如果要查‘20041010’一天的数据.下面的方法用不到索引
Select * from test where to_char(dt,’yyyymmdd’) =‘20041010’;@H_403_6@ 而select * from test where dt >=to_date(‘20041010’,’yyyymmdd’) and dt < to_date(‘20041010’,’yyyymmdd’) + 1 将会用到索引。
15.如果能不用到排序,则尽量避免排序。
用到排序的情况有
集合操作。Union,minus,intersect等,注:union all 是不排序的。
Order by@H_403_6@ Group by@H_403_6@ Distinct@H_403_6@ In
有时候也会用到排序
确实要排序的时候也尽量要排序小数据量
,尽量让排序在内存中执行,有文章说,内存排序的速度是硬盘排序的1万倍。@H_403_6@ @H_502_36@
在排序的字段上创建索引,让排序在内存中执行,加快排序速度。@H_502_36@
16.在基于CBO的优化器(花费)下,表的统计数据过期。也可能导致不使用索引。@H_502_36@
17.获取的数据量过大,全部扫描效率更高@H_502_36@
18.索引字段的值分散率太低,值太集中,如类型字段都是1,2, 状态类型Y-有效/N-无效。这类型的字段最好别建索引。@H_502_36@
尽管在这些字段上建立了索引,但对全表数据区分度不大。最后还是会全表扫描。@H_502_36@