例如,如果数据大小达到500 TB等
解决方法
共享磁盘系统(如Oracle Real Application Clusters或Clustered SQL Server安装仍然需要一个共享的SAN,它具有约束的流量带宽,在VLDB上可以严重限制可能达到的表扫描性能,大多数数据仓库查询运行表或范围扫描大块数据,如果查询将超过几个百分比的行,单个表扫描通常是最佳查询计划.
节点上的多个本地直连磁盘阵列提供了更多的磁盘带宽.
说过我知道一个Oracle DW商店(一个主要的欧洲电信公司)拥有一个基于oracle的数据仓库,每天加载600 GB,所以共享磁盘架构似乎并没有施加不可逾越的限制.
在MS-sql和Oracle之间有一些差异. IMHO Oracle具有比sql Server更好的VLDB支持,原因如下:
> Oracle本来支持bitmap indexes,这是适用于高速数据仓库查询的索引结构.他们基本上做一个cpu用于I / O权衡,因为它们是运行长度编码的,并且使用相对较小的空间.另一方面,微软声称Index Intersection并没有明显变慢.
> Oracle具有比sql Server更好的表分区功能. IIRC sql Server 2005中的表分区只能在单个列上完成.
> Oracle可以运行于sql Server somewhat larger hardware,尽管可以在某些quite respectably large系统上运行sql Server.
> Oracle对Materialized views和Query rewrite更为成熟的支持来优化关系查询. sql2005确实具有一些查询重写功能,但是它的文档记录不足,并且我没有看到它在生产系统中使用.但是,Microsoft建议您使用Analysis Services,它实际上支持无共享配置.
除非你有真正的圣经数据量,而且在Oracle和一个没有共享的架构(如Teradata)之间进行选择,你可能会看到Oracle和sql Server之间几乎没有实际的区别.特别是自从引入sql2005以来,sql Server中的分区功能被视为足够好,examples的examples系统已经在其上成功实现.