本文共 12383 字,大约阅读时间需要 41 分钟。
Dataguard 环境:
操作系统:Redhat6.4
Primary数据库:
IP 地址:192.168.1.122 数据库SID:ora11g DB_UNIQUE_NAME:ora11g_primaryStandby数据库:
IP 地址:192.168.1.123 数据库SID:ora11g DB_UNIQUE_NAME:ora11g_standby(注:oracle数据库版本是11.2.0.1.0)
1.Primary端的配置
(1).检查数据库是否支持 Data Guard(企业版才支持),是否归档模式,Enable force logging$ sqlplus '/as sysdba'
SQL> select * from v$option where parameter = 'Managed Standby'; 确认主库处于归档模式 SQL> archive log list (先检查是否归档模式,不是则修改) startup mount alter database archivelog; alter database open;(2)将primary 数据库置为 FORCE LOGGING模式
SQL> alter database force logging; (强制产生日志)
如果主库没有密码文件则建立密码文件,从而可以 OS验证的方式登陆 $ orapwd file=$ORACLE_HOME/dbs/orapwora11g password=oracle entries=5(3)为主数据库添加备用联机日志文件
SQL> alter database add standby logfile group 4 ('/u01/app/oracle/oradata/ora11g/stdby_redo04.log') size 50m; alter database add standby logfile group 5 ('/u01/app/oracle/oradata/ora11g/stdby_redo05.log') size 50m; alter database add standby logfile group 6 ('/u01/app/oracle/oradata/ora11g/stdby_redo06.log') size 50m; alter database add standby logfile group 7 ('/u01/app/oracle/oradata/ora11g/stdby_redo07.log') size 50m; standby redolog的组数参考公式:(online redolog组数 + 1) * 数据库线程数;单机线程数为1,RAC一般为2。 standby redolog的组成员数和大小也尽量和online redolog一样。 (注:在备库中也要建立相同的standbylog组。)(4)修改主库参数文件
SQL> create pfile from spfile;主库
DB_NAME=ora11g DB_UNIQUE_NAME=ora11g_primary LOG_ARCHIVE_CONFIG='DG_CONFIG=(ora11g_primary ,ora11g_standby)' LOG_ARCHIVE_DEST_1='LOCATION=/u01/app/oracle/archive VALID_FOR=(ALL_LOGFILES,ALL_ROLES) DB_UNIQUE_NAME=ora11g_primary' LOG_ARCHIVE_DEST_2='SERVICE=ora11g_standby LGWR ASYNC VALID_FOR=(ONLINE_LOGFILES,PRIMARY_ROLE) DB_UNIQUE_NAME=ora11g_standby' LOG_ARCHIVE_DEST_STATE_1=ENABLE LOG_ARCHIVE_DEST_STATE_2=ENABLE REMOTE_LOGIN_PASSWORDFILE=EXCLUSIVE LOG_ARCHIVEFORMAT=%t%s_%r.arc FAL_SERVER=ora11g_standby FAL_CLIENT=ora11g_primary STANDBY_FILE_MANAGEMENT=AUTO(5)建立备用库的控制文件
SQL>shutdown immediateSQL>startup mount
SQL> alter database create standby controlfile as '/u01/standby_ctl01.ctl';(6)配置listener.ora和tnsnames.ora
Listener.ora 文件:
SID_LIST_LISTENER =
(SID_LIST = (SID_DESC = (GLOBAL_DBNAME = ora11g) (SID_NAME = ora11g) (ORACLE_HOME = /home/db/oracle/product/11.2.0/dbhome_1) ) )LISTENER =
(DESCRIPTION_LIST = (DESCRIPTION = (ADDRESS = (PROTOCOL = TCP)(HOST = DG-Primary)(PORT = 1521)) ) )ADR_BASE_LISTENER = /u01/app/oracle
tnsnames.ora文件:
ORA11G_PRIMARY =
(DESCRIPTION = (ADDRESS = (PROTOCOL = TCP)(HOST = 192.168.1.122)(PORT = 1521)) (CONNECT_DATA = (SERVER = DEDICATED) (SERVICE_NAME = ora11g) ) ) ORA11G_STANDBY = (DESCRIPTION = (ADDRESS = (PROTOCOL = TCP)(HOST = 192.168.1.123)(PORT = 1521)) (CONNECT_DATA = (SERVER = DEDICATED) (SERVICE_NAME = ora11g) ) )(7)主库用修改过的PFILE 生产SPFILE
关闭主数据库 SQL>shutdown immediate 生成spfile SQL> create spfile from pfile;2.Standby端的配置
(1). 创建备库存放数据文件和后台跟踪目录
mkdir -p $ORACLE_BASE/oradata/ora11gmkdir -p $ORACLE_BASE/admin/ora11g
mkdir -p $ORACLE_BASE/admin/ora11g/adump
mkdir -p $ORACLE_BASE/admin/ora11g/bdump
mkdir -p $ORACLE_BASE/admin/ora11g/cdump
mkdir -p $ORACLE_BASE/admin/ora11g/dpdump
mkdir -p $ORACLE_BASE/admin/ora11g/pfile
mkdir -p $ORACLE_BASE/admin/ora11g/udump
mkdir -p $ORACLE_BASE/diag/rdbms
mkdir -p $ORACLE_BASE/diag/tnslsnr
mkdir -p $ORACLE_BASE/flash_recovery_area/ora11g mkdir -p $ORACLE_BASE/flash_recovery_area/ORA11g mkdir -p $ORACLE_BASE/archive(2).把文件传输到备库下
关闭主库复制文件 $scp $ORACLE_BASE/oradata/.dbf 192.168.1.123:/$ORACLE_BASE/oradata/ora11g $scp $ORACLE_BASE/oradata/.log 192.168.1.123:/$ORACLE_BASE/oradata/ora11g $scp /u01/standby_ctl01.ctl 192.168.1.123:/$ORACLE_BASE/oradata/ora11g $scp $ORACLE_HOME/dbs/initora11g.ora 192.168.1.123: $ORACLE_HOME/dbs/ $ cd $ORACLE_BASE/oradata/ora11g $ mv standby_ctl01.ctl control01.ctl $ cp control01.ctl /u01/app/oracle/flash_recovery_area/ora11g/ $cd /u01/app/oracle/flash_recovery_area/ora11g/ $ mv control01.ctl control02.ctl(3)建立密码文件
如果主库没有密码文件则建立密码文件,从而可以 OS验证的方式登陆 $ orapwd file=$ORACLE_HOME/dbs/orapwora11g password=oracle entries=5 (4)修改备库参数文件 DB_NAME=ora11g DB_UNIQUE_NAME=ora11g_standby LOG_ARCHIVE_CONFIG='DG_CONFIG=(ora11g_primary ,ora11g_standby)' LOG_ARCHIVE_DEST_1='LOCATION=/u01/app/oracle/archive VALID_FOR=(ALL_LOGFILES,ALL_ROLES) DB_UNIQUE_NAME=ora11g_standby' LOG_ARCHIVE_DEST_2='SERVICE=ora11g_primary LGWR ASYNC VALID_FOR=(ONLINE_LOGFILES,PRIMARY_ROLE) DB_UNIQUE_NAME=ora11g_primary' LOG_ARCHIVE_DEST_STATE_1=ENABLE LOG_ARCHIVE_DEST_STATE_2=ENABLE REMOTE_LOGIN_PASSWORDFILE=EXCLUSIVE LOG_ARCHIVEFORMAT=%t%s_%r.arc FAL_SERVER=ora11g_primary FAL_CLIENT=ora11g_standby STANDBY_FILE_MANAGEMENT=AUTO(4)修改备库的listener.ora和tnsnames.ora,如果没有的话,可以直接从主库复制过去
Listener.ora 文件:
SID_LIST_LISTENER =
(SID_LIST = (SID_DESC = (GLOBAL_DBNAME = ora11g) (SID_NAME = ora11g) (ORACLE_HOME = /home/db/oracle/product/11.2.0/dbhome_1) ) )LISTENER =
(DESCRIPTION_LIST = (DESCRIPTION = (ADDRESS = (PROTOCOL = TCP)(HOST = DG-Standby)(PORT = 1521)) ) )ADR_BASE_LISTENER = /u01/app/oracle
tnsnames.ora文件:
ORA11G_PRIMARY =
(DESCRIPTION = (ADDRESS = (PROTOCOL = TCP)(HOST = 192.168.1.122)(PORT = 1521)) (CONNECT_DATA = (SERVER = DEDICATED) (SERVICE_NAME = ora11g) ) ) ORA11G_STANDBY = (DESCRIPTION = (ADDRESS = (PROTOCOL = TCP)(HOST = 192.168.1.123)(PORT = 1521)) (CONNECT_DATA = (SERVER = DEDICATED) (SERVICE_NAME = ora11g) ) )(5)复制主库的密码文件到备库的相应位置(注:如果主备库不能同步很可能就是密码文件不一样)
先查看备份库是否有密码文件,有就先删除,然后再复制。
scp $ORACLE_HOME/dbs/orapwora11g 192.168.1.123:/$ORACLE_HOME/dbs/3.Dataguard启动
(1)启动顺序,先启动备库,然后再启动主库启动standby database
SQL>startup nomount SQL>alter database mount standby database; #执行此命令后备库会处于手动恢复状态。启动primary database
SQL>startup mount SQL>alter database set standby database to maximize availability; (设置为最大性能模式也是默认模式) SQL>alter database open; 启动standby database到recover manage模式SQL>alter database recover managed standby database disconnect from session;
#执行此命令后,备库会切换到自动恢复模式。如果要启动到实时日志应用模式 (注:前提必须创建standby logfile)
alter database recover managed standby database using current logfile; #切换备库到适时应用日志模式,即real-time apply。执行这个命令后光标会停止在那里。
或者alter database recover managed standby database using current logfile disconnect from session; #执行这个命令后,会切断这个session,执行的功能与上面相同。 SQL>alter database recover managed standby database using current logfile disconnect from session;切换standby database到read only模式
SQL> alter database recover managed standby database cancel; #首先取消备库的自动恢复模式
SQL>alter database open read only; 如果要切换回recover manage模式(启动日志应用或者启动日志实时应用) SQL> alter database recover managed standby database disconnect from session; 启动日志应用 SQL>alter database recover managed standby database using current logfile disconnect from session; 启动日志实时应用4、启动和关闭顺序
启动顺序
(1).启从、主库的监听Listener
从库DG-Standby: $lsnrctl start主库DG-Primary:
$lsnrctl start(2).启动备库数据库,执行如下:
$sqlplus /nolog SQL>conn /as sysdba SQL> startup nomount SQL> alter database mount standby database; #让备库处于standby SQL> alter database recover managed standby database using current logfile disconnect from session; ; #开始实时同步(3).启动主库
$sqlplus /nolog SQL>conn /as sysdba SQL> startup .切换standby database到read only模式SQL> alter database recover managed standby database cancel; #首先取消备库的自动恢复模式
SQL>alter database open read only; 如果要切换回recover manage模式(启动日志应用或者启动日志实时应用) SQL> alter database recover managed standby database disconnect from session; 启动日志应用 SQL>alter database recover managed standby database using current logfile disconnect from session; 启动日志实时应用(3).启动主库数据库(上述第二步执行完毕后,方可执行如下命令):
SQL>startup关闭顺序
关闭的时候正好相反,先关闭主库,然后关闭从库。
(1). 关闭主库 $su – oracle SQL>sqlplus /nolog SQL>conn /as sysdba SQL>shutdown immediate; (2). 关闭从库 su – oracle SQL>sqlplus /nolog SQL>conn /as sysdba SQL>alter database recover managed standby database cancel; #停止同步 SQL>shutdown immediate5、功能切换
Switchover状态切换首先在primary上操作:
(1). 验证主库是否能执行角色转换到备库(原主库执行)
SQL> SELECT SWITCHOVER_STATUS FROM V$DATABASE;
SWITCHOVER_STATUSTO STANDBY 1 row selected
(2).开始把物理主库改变为物理备库(原主库执行)
SQL> ALTER DATABASE COMMIT TO SWITCHOVER TO PHYSICAL STANDBY;
或 SQL> ALTER DATABASE COMMIT TO SWITCHOVER TO PHYSICAL STANDBY with session shutdown; 注:如果有活动的session可以使用此选项,否则转换会遇到ORA-01093错误,也可以杀掉活动会话或等活动会话后进行转换 (3).关闭并重启主库(原主库执行) SQL> shutdown immediate SQL> startup nomount SQL> alter database mount standby database; #让备库处于standby SQL> alter database recover managed standby database using current logfile disconnect from session; ; #开始实时同步然后在standby上操作:
(1).验证备库是否能执行角色转换到主库(原备库执行) SQL> SELECT SWITCHOVER_STATUS FROM V$DATABASE; SWITCHOVER_STATUSTO_PRIMARY
1 row selected(2).开始把物理备库转换成物理主库(原备库执行)
SQL> ALTER DATABASE COMMIT TO SWITCHOVER TO PRIMARY; --如果报ORA-16139: media recovery required,可能是由于未应用日志引起,可先执行 ALTER DATABASE RECOVER MANAGED STANDBY DATABASE DISCONNECT FROM SESSION;(3)打开备库,然后关闭重启.(原备库执行)
SQL> SHUTDOWN IMMEDIATE; SQL> STARTUP;(4) 验证是否转换成功(原备库执行)
SQL> ALTER SYSTEM SWITCH LOGFILE;启动日志应用
(5) 应用归档日志(原主库上执行)
SQL> ALTER DATABASE RECOVER MANAGED STANDBY DATABASE USING CURRENT LOGFILE DISCONNECT FROM SESSION;小窍门:要想顺利的实现switchover,最好在每台server上都同时设置好primary和standby的一些初始化参数,虽然其中一些参数只有在primary或者standby其中之一上起作用。
应急切换
(注:模拟主库由于故障无法正常switchover,需要执行failover,强制备库->pridb并接管业务)
(1).备库:
由于是failover,所以理解主库这时候已经无法正常使用,只需备库切换至pridb
停止应用恢复模式
alter database recover managed standby database finish;
转换standbydb为primary db
alter database commit to switchover to primary;
重启数据库,恢复正常业务
SQL>shutdown immediate
SQL>startup
select open_mode,database_role from v$database;
OPEN_MODE DATABASE_ROLE
OPEN PRIMARY
注:failover将破坏dataguard模式,需要重新配置dataguard,网上也说不需要配置,但是还没有测试成功
Failover状态切换
在备库上进行切换: 1.首先停止备库的自动恢复状态: SQL>alter database recover managed standby database finish; 如果没有使用过standby redo log的话执行: SQL>alter database recover managed standby database finish skip standby logfile; 2.切换备库到主库: SQL>alter database commit to switchover to primary;在备库上执行切换:
1:alter database recover managed standby database cancel; 2:alter database activate standby database; 3:shutdown immediate总结一下Failover 和 Switchover 的区别:
在9i 的dataguad环境中:
1:执行Switch Over 必须是Primary 正常,并且是必须Primary 主动先Switch成 standby.然后standby 才能switch 成primary。 2:如果需要作成primary出问题,standby 能接管的话,必须作 failover ,而不是SwitchOver。Failover :
将主数据库offline,备用数据库online,这种操作由系统和软件失败引起。 即使在备用数据库上应用重做日志,也可能出现数据丢失的现象,除非备用数据库运行在 guaranteed protection 模式。 原主数据库重新使用时必须重新启动实例。 其它的备用数据库也需重新启动实例。Switchover :
故意将主数据库offline,而将另一备用数据库online,它能够切换到备用数据库而不需同步操作。如:可使用 Switchover 完成系统的平滑升级。 即使在备用数据库上不应用重做日志,也不会造成数据的丢失。 数据库不需重新启动实例。这使主数据库几乎能立即在备用数据库上恢复它的功能,因此可经常进行定期维护而不需中断操作。 Failover和Switchover的区别为: 当Failover发生,备用数据库切换为主数据库之后,它丢失了备用数据库的所有能力,也就是说,不能再返回到备用模式;而Switchover可以,备用数据库可切换为主数据库,也可从主数据库再切换回备用数据库。四、相关视图
v$archive_dest v$archive_dest_status v$log_history v$archvied_log v$managed_standby v$archive_gap6、常见问题
(1). 日志无法传送
SQL>select dest_name,status,error from v$archive_dest; 察看相应的归档路径的状态是否 valid ,否则根据error 信息进行处理 (2). 无法使用alter database 重命名 data file 在standby 上,当设置 standby_file_management 为auto 时,不允许下列操作 alter database rename alter database add/drop logfile alter database add/drop standby logfile member alter database create datafile as (3). switchover 失败 SQL>alter database commit to switchover to physical standby 错误: ORA-01093:alter database close only permitted with no session connected 可以察看引起该错误的活动 session SQL> select sid,process,program from v$session where type='USER' and sid<>(select distinct sid from v$mystat); 然后根据查出的 sid 结合v$session 视图最后用 alter system kill session ‘ sid,serial’ 来kill 掉进程,断开该 session 或者使用如下命令来做 switchover SQL>alter database commit to switchover to physical standby with session shutdown; (4). 在standby database 的 read only模式下做 report 时出现错误: ora-01220:file base sort illegal before database is open. 可能原因: standby database 没有temporary tablespace (5).当主机和备机在运行过程中,把备机停下来,主机的归档日志将不能传到备机,当把备机服务起来后,主机的归档日志也不能传到备机,需要把主机的所有服务都重启一次才可以传日志。 请问为什么需要把主机要重启一次呢?有没有不需要重启主机就可以解决此问题呢? 发生这种情况时,核查几处: ( 1) . show parameter log_archive_dest ; ( 2) . select REOPEN_SECS,MAX_FAILURE from V$ARCHIVE_DEST; 察看是否是因为由于备机没有开机,造成 primary node 无法正常传送 archived log,并且达到了最大允许的失败次数。如果是这样,可以通过 alter system set log_archive_dest... 来重置属性值,恢复日志的正常传送。 也可以手工传送相关的日志到备机, 对于物理standby : ALTER DATABASE REGISTER LOGFILE '/xxx/xxx/arcr_xxx.arc' 对于逻辑standby : ALTER DATABASE REGISTER LOGICAL LOGFILE '/xxx/xxx/arcr_xxx.arc' (3). 执行SELECT MESSAGE FROM V$DATAGUARD_STATUS; 察看相关信息,还有根据 dataguard 的不同类型来察看相关的 view 来确定当前的状态,具体参见 dataguard 的官方文档。本文转自lq201151CTO博客,原文链接: http://blog.51cto.com/liuqun/2049164,如需转载请自行联系原作者