http://blog.chinaunix.net/uid-25806228-id-2141469.html
Oracle Fail Safe 是架构在 Microsoft Cluster Server(MSCS)上的一个 Oracle 产品,为Oracle 的一些产品(数据库、Oracle Application Server 等)提供高可用性。提供数据、应用程序在出现故障的情况下,将Oracle数据库自动转换到另一个激活的系统上,保证系统的高可用性。
2.群集服务器安装核对清单 2.1硬件配置· 两台联想万全T350服务器,每台机器具体配置如下:
两颗cpu: Xeon 1.8G/512K
网卡
每台服务器都有两块Intel 82550网卡
单模组,不需要冗余电源
· 一台SCSI Ultra 160磁盘柜
2.2软件配置· Windows2000中文版(集群中所有机器上进行安装)
· MSCS群集软件(集群中所有机器上进行安装)
· Oracle8.1.6 或者 Oracle9.0.1.0.1 (集群中所有机器上进行安装)
· Oracle FailSafe (集群中所有机器上进行安装)
· GAM5.0
2.3 硬件环境硬件环境配置如下:
这是一个两节点群集,每台服务器有两块网卡,一块作为内部连接,用于服务器之间的心跳线和数据镜像传输;一块连接到外部网上。
3.安装使用指南 3.1 安装 Windows2000(两台及其均安装)1. 相关参数配置参见下表:表 1 群集安装实验参数表
服务器名
NS1
NS2
公用网络IP1
192.168.34.1
192.168.34.2
公用网络子网掩码
255.255.255.0
255.255.255.0
专用网络IP
192.168.33.1
192.168.33.2
专用网络子网掩码
255.255.255.0
255.255.255.0
集群虚拟IP
192.168.34.3
集群虚拟名
Fscluster
FailSafe数据库虚拟IP
192.168.34.3
集群虚拟IP子网掩码
255.255.255.0
2.ping所有IP地址以确保连接正确。
3.2 安装GAM5.0磁盘管理软件1. 在Windows中添加一个具有administrator权限的用户gamroot;
2. 在其中在其中一台机器上安装磁盘管理软件GAM5.0;
3. 利用GAM管理工具对磁盘进行划分,此处划分为E: 、F:和G:。
关于GAM的使用方法详细参见相应文档。
3.3 安装MSCS打开主服务器,关闭从服务器。在主服务器上安装MSCS。安装成功后,保证在主服务器开启的情况下,在从服务器上安装MSCS。
详细安装参见相关文档。
安装成功后测试,保证MSCS安装成功。
3.4 安装Oracle在主服务器上安装Oracle,选择自定义安装,安装过程不创建数据库,安装结束重新启动主服务器;
在从服务器上安装Oracle,选择自定义安装,安装过程不创建数据库,安装结束重新启动从服务器。
3.5创建数据库在主服务器上创建要添加到集群中的数据库。注意 Control 文件、redo log files 和 data files 必须创建在磁盘柜的共享分区上;初始化参数文件也要放在磁盘柜上,如果是Oracle9.0.1.0.1,选择不生成永久初始化文件,安装结束后,将初始化文件放入共享磁盘柜中,然后在注册表中修改,将HKEY_LOCAL_MACHINE | SOFTWARE | Oracle| HOME0| ORA_HA1TEST_PFILE,修改为在磁盘柜上的目录,例如I:\initha1test.ora。
3.6 安装FailSafe在主服务器上安装FailSafe3.2,安装完重新启动主服务器;
再在从服务器上安装FailSafe3.2,安装完重新启动从服务器。
注:在安装完 fail safe 后,Windows 2000 中的群集管理器中 群集配置 –〉 资源类型 –〉下会出现两个资源类型:Oracle Database 和 Oracle TNS Listener,两者使用的资源 DLL 都是 FsResOdbs.dll 。
3.7修改hosts文件在两台机器上修改文件c:\winnt\system32\drivers\etc\hosts 如下:
192.168.34.1 ns1 (节点1的外部连接)
192.168.34.2 ns2 (节点2的外部连接)
192.168.33.1 san1 (节点1的内部连接)
192.168.33.2 san2 (节点2的内部连接)
192.168.34.3 fscluster(MSCS Cluster 的别名,也就是虚拟 IP的别名)
192.168.34.4 ha1test (Oracle 集群使用的 IP 和网络名称)
3.8 集群配置1、 打开 Oracle Fail Safe Manager
Start->Programs->->Oracle Fail Safe Manager
打开后出现 Add Cluster to Tree 对话框,在该对话框里输入 CLUSTER 名称,会
提示输入在域里有管理权限的用户名和密码;输入后会出现 Verify Cluster 对话
框,对该集群各项资源进行有效性验证;
2、 在每台节点机上检查是否有服务 OracleMSCSServices,并启动该服务;
3、 在每台节点机上启动集群管理器(启动 -> 程序 -> 管理工具 -> 集群管理器),在 Cluster Group 检查是否有Oracle Services for MSCS这一项;并检查 Resource Types 中是否有Oracle Database和Oracle TNS Listener。
4、 在 Oracle Fail Safe Manager 中的Groups菜单里选择Create;打开Create Group Wizard后可以设置 failover 和 failback 策略,并自动打开Add Resource to Group Wizard可以向组添加virtual address(选择Resources,然后Add to Group)。
首先选择菜单:
出现界面,输入组名:
点击下一步,选择是否failback。
点击下一步,选择优先级别:
按完成结束组的创建。
5、 在 Troubleshooting 菜单上选择 Verify Standalone Database 验证 Oracle数据库以及 Oracle Net 配置,该命令确认 Oracle Fail Safe 可以访问数据库,并且 standlone 数据库位于共享分区上;
6、 在 Resources 菜单上选择 Add to Group,然后选择 Oracle Database打开 Add Resource to Group Wizard,该向导用来将 single-instance Oracle database server 配置为基于 MSCS 的高可用性数据库服务器;
选择菜单:
出现界面,选择OracleDatabase:
出现配置集群界面:
安装成功后,出现如下图提示,则安装成功完成。
安装成功后,关于数据库在注册表中的配置,从服务器上的注册表将会自动和主服务器同步。
注:在 FailSafe 里添加组 grptest 并将数据库群集添加后,在群集管理器里也增加了该组,组包含的内容有:IP Address 192.168.34.4、Network Name fscluster、Disk E:、F:OracleOraHome81TNSListenerFslfscluster 和 HA1TEST.mjlab.com(数据库实例名)
3.10测试从主机切换到从机,切换时间为50秒,应用程序略有停滞感,切换成功后应用恢复正常。
非正常关掉主服务器,可以正常切换,切换时间为57秒,应用程序略有停滞,切换成功后应用恢复正常。
拔掉主机应用网线之后,可以正常切换,切换时间为50秒,应用程序略有停滞感,切换成功后应用恢复正常。