我们知道Oracle会
自动为表的主键列建立索引,这个默认的索引是普通的B-Tree索引。对于主键值是按顺序(递增或递减)加入的情况,默认的B-Tree索引并不理想。这是因为如果索引列的值具有严格顺序时,随着数据行的插入,索引树的层级增长很快。
搜索索引发生的I/O读写
次数和索引树的层级数成正比,也就是说,一棵具有5个层级的B -Tree索引,在最终读取到索引数据时最多可能发生多达5次I/O操作。因而,减少索引的层级数是索引
性能调整的一个重要
方法。
如果索引列的数据以严格的有序的方式插入,那么B-Tree索引树将变成一棵不对称的"歪树",如图 5所示:
而如果索引列的数据以随机值的方式插入,我们将得到一棵趋向对称的索引树,如图 6所示:
比较图 5和图 6,在图 5中搜索到A块需要进行5次I/O操作,而图 6仅需要3次I/O操作。
既然索引列数据从序列中获取,其有序性无法规避,但在建立索引时,Oracle允许对索引列的值进行反向,即预先对列值进行比特位的反向,如 1000,10001,10011,10111,1100经过反向后的值将是0001,1001,1101,0011。显然经过位反向处理的有序数据变得比较随机了,这样所得到的索引树就比较对称,从而提高表的查询性能。
但反向键索引也有它局限性:如果在WHERE语句中,需要对索引列的值进行范围性的搜索,如BETWEEN、<、>等,其反向键索引无法使用,此时,Oracle将执行全表扫描;只有对反向键索引列进行 <>和 = 的比较操作时,其反向键索引才会得到使用。
1.反向索引应用场合
1)发现索引叶块成为热点块时使用
通常,使用数据时(常见于批量插入操作)都比较集中在一个连续的数据范围内,那么在使用正常的索引时就很容易发生索引叶子块过热的现象,严重时将会导致系统性能下降。
2)在RAC环境中使用
当RAC环境中几个节点访问数据的特点是集中和密集,索引热点块发生的几率就会很高。如果系统对范围检索要求不是很高的情况下可以考虑使用反向索引技术来提高系统的性能。因此该技术多见于RAC环境,它可以显著的降低索引块的争用。
2.使用反向索引的优点
最大的优点莫过于降低索引叶子块的争用,减少热点块,提高系统性能。
3.使用反向索引的缺点
由于反向索引结构自身的特点,如果系统中经常使用范围扫描进行读取数据的话(例如在where子句中使用“between and”语句或比较运算符“>”“<”等),那么反向索引将不适用,因为此时会出现大量的全表扫描的现象,反而会降低系统的性能。
有时候可以通过改写sql语句来避免使用范围扫描,例如where id between 12345 and 12347,可以改写为where id in(12345,12346,12347),CBO会把这样的SQL查询转换为where id=12345 or id=12346 or id=12347,这对反向索引也是有效的。
4.通过一个小实验简单演示一下反向索引的创建及修改
- sql>selectcount(*)fromt1;
- COUNT(*)
- 0
- sql>fromt2;
- fromt3;
- 2000000
- selectINDEX_NAME,INDEX_TYPE,TABLE_NAMEfromuser_indexes;
- INDEX_NAMEINDEX_TYPETABLE_NAME
- ---------------------------------------------------------------------------------------
- PK_T2NORMAL/REVT2
- PK_T1NORMALT1
表t1是主键是正常的主键,表t2的主键是反向主键。现在我把表t3的数据分别插入到表t1和表t2
set
timingon;
setautotraceon;
insert/*+append*/intot1select*已创建2000000行。
已用时间:00:01:42.83
执行计划
----------------------------------------------------------
Planhashvalue:4161002650
---------------------------------------------------------------------------------
|Id|Operation|Name|Rows|Bytes|Cost(%cpu)|Time|
|0|INSERTSTATEMENT||2316K|485M|19014(1)|00:03:49|
|1|LOADTABLECONVENTIONAL|T1|||||
|2|TABLEACCESSFULL|T3|2316K|485M|19014(1)|00:03:49|
Note
-----
-dynamicsamplingusedforthisstatement(level=2)
统计信息
----------------------------------------------------------
12305recursivecalls
538835dbblockgets
203937consistentgets
83057physicalreads
428323528redosize
688bytessentviasql*Nettoclient
614bytesreceivedviasql*Netfromclient
3sql*Netroundtripsto/fromclient
2sorts(memory)
0sorts(disk)
2000000rowsprocessed
commit;
提交完成。
已用时间:00:00:00.04
intot2fromt3;
已创建2000000行。
已用时间:00:02:02.63
执行计划
Planhashvalue:4161002650
---------------------------------------------------------------------------------
Time|
INSERTSTATEMENT||2316K|485M|19014(1)|00:03:49|
TABLECONVENTIONAL|T2|||||
FULL|T3|2316K|485M|19014(1)|00:03:49|
Note
-----
level=2)
统计信息
7936recursivecalls
6059147dbblockgets
158053consistentgets
56613physicalreads
790167468redosize
689bytessentviasql*Nettoclient
2sorts(memory)
0sorts(disk)
rowsprocessed
commit;
提交完成。
已用时间:00:00:00.01
可以看见:由于反向索引的数据块比较分散了后,db block gets要稍微高一些。热块的争用有所缓解,consistent gets有所下降,从203937下降到158053,减少了45884次。redo size 也变多了!再来做查询,来看看他们的区别。
set
autotracetraceonly;
selectOBJECT_NAMEfromt1whereid=100;
已用时间:00:00:00.06
Planhashvalue:1141790563
-------------------------------------------------------------------------------------
SELECTSTATEMENT||1|79|0(0)|00:00:01|
BYINDEXROWID|T1|1|79|0(0)|00:00:01|
|*2|INDEXUNIQUESCAN|PK_T1|1||0(0)|00:00:01|
PredicateInformation(identifiedbyoperationid):
---------------------------------------------------
2-access("ID"=100)
0recursivecalls
0dbblockgets
4consistentgets
3physicalreads
0redo434bytessentviasql*Net416bytesreceivedviasql*Net2sql*Netroundtrips0sorts(memory)
1whereid>100andid<200;
已选择99行。
已用时间:00:00:01.10
Planhashvalue:1249713949
SELECTSTATEMENT||99|7821|1(0)|00:00:01|
INDEXROWID|T1|99|7821|1(0)|00:00:01|
INDEXRANGESCAN|PK_T1|99||1(0)|00:00:01|
"ID">100AND"ID"<200)
9recursivecalls
140consistentgets
189physicalreads
2356redo2656bytessentviasql*Net482bytesreceivedviasql*Net8sql*Netroundtrips99fromt2已用时间:00:00:00.05
Planhashvalue:1480579010
INDEXROWID|T2|1|79|0(0)|00:00:01|
UNIQUESCAN|PK_T2|1||0(0)|00:00:01|
1recursivecalls
1physicalreads
已用时间:00:00:04.39
Planhashvalue:1513984157
--------------------------------------------------------------------------
SELECTSTATEMENT||336|26544|8282(1)|00:01:40|
|*1|FULL|T2|336|26544|8282(1)|00:01:40|
--------------------------------------------------------------------------
byoperationid):
---------------------------------------------------
1-filter("ID"<200)
29recursivecalls
1dbblockgets
60187consistentgets
30335physicalreads
5144redo0sorts(memory)
rowsprocessed
可以看见,单个值查询的时候,表t1和表t2并无差别,但是范围查询的时候,表t1是INDEX RANGE SCAN,表t2是TABLE ACCESS FULL了。在数据库的优化中你经常会发现没有绝对的好,也没有绝对的差。
在考虑使用反向索引之前,大多数情况可以考虑对索引进行散列分区(hash)来减少索引叶块的争用。
反向索引:alter index id_inx rebuild reverse online;alter index id_inx rebuild online reverse;alter index name_inx rebuild online noreverse;