Username: Password:

数据库系统紧急故障处理方法
来源:作者: 发布时间:2007-12-18 08:01:46

Oracle物理结构故障是指构成数据库的各个物理文档损坏而导致的各种数据库故障。这些故障可能是由于硬件故障造成的,也可能是人为误操作而引起。所以我们首先要判断问题的起因,假如是硬件故障则首先要解决硬件问题。在无硬件问题的前提下我们才能按照下面的处理方发来进一步处理。

  控制文档损坏:

  控制文档记录了关于oracle的重要配置信息,如数据库名、字符集名字、各个数据文档、日志文档的位置等等信息。控制文档的损坏,会导致数据库异常关闭。一旦缺少控制文档,数据库也无法启动,这是一种比较严重的错误。

  损坏单个控制文档:

  1. 确保数据库已关闭,假如没有用下面的命令来关闭数据库:

  svrmgrl>shutdown immediate;

  2. 查看初始化文档$ORACLE_BASE/admin/pfile/initORCL.ora,确定任何控制文档的路径。
 
  3. 用操作系统命令将其他正确的控制文档覆盖错误的控制文档。

  4. 用下面的命令重新启动数据库:

  svrmgrl>startup;

  5. 用适当的方法进行数据库全备份。

  损坏任何的控制文档:

  1. 确保数据库已关闭,假如没有用下面的命令来关闭数据库:

  svrmgrl>shutdown immediate;

  2. 从相应的备份结果集中恢复最近的控制文档。对于没有采用带库备份的点能够直接从磁带上将最近的控制文档备份恢复到相应目录;对于采用带库备份的点用相应的rman脚本来恢复最近的控制文档。

  3. 用下面的命令来创建产生数据库控制文档的脚本:

svrmgrl>startup mount;

svrmgrl>alter database backup controlfile to trace noresetlogs;

  4. 修改第三步产生的trace文档,将其中关于创建控制文档的一部分语句拷贝出来并做些修改,使得他能够体现最新的数据库结构。假设产生的sql文档名字为createcontrol.sql.

  注意:

  Trace文档的具体路径能够在执行完第3步操作后查看$ORACLE_BASE/admin/bdump/alert_ORCL.ora文档来确定。

  5. 用下面命令重新创建控制文档:

  svrmgrl>shutdown abort;

  svrmgrl>startup nomount;

  svrmgrl>@createcontrol.sql;

  6. 用适当的方法进行数据库全备份。

  重做日志文档损坏:

  数据库的任何增、删、改都会记录入重做日志。假如当前激活的重做日志文档损坏,会导致数据库异常关闭。非激活的重做日志最终也会因为日志转换变为激活的重做日志,所以损坏的非激活的重做日志最终也会导致数据库的异常终止。在ipas/mSwitch中每组重做日志只有一个成员,所以在下面的分析中只考虑重做日志组损坏的情况,而不考虑单个重做日志成员损坏的情况。

  确定损坏的重做日志的位置及其状态:

  1. 假如数据库处于可用状态:

  select * from v$logfile;

  svrmgrl>select * from v$log;

  2. 假如数据库处于已异常终止:

  svrmlgr>startup mount;
  svrmgrl>select * from v$logfile;
  svrmgrl>select * from v$log;

  其中,logfile的状态为INVALID表示这组日志文档出现已损坏;log状态为Inactive:表示重做日志文档处于非激活状态;Active: 表示重做日志文档处于激活状态;Current:表示是重做日志为当前正在使用的日志文档。

  损坏的日志文档处于非激活状态:

  1. 删除相应的日志组:

  svrmgrl>alter database drop logfile group group_number;

  2. 重新创建相应的日志组:

  svrmgrl>alter database add log file group group_number (’log_file_descritpion’,…) size log_file_size;

  损坏的日志文档处于激活状态且为非当前日志:

  1. 清除相应的日志组:

  svrmgrl>alter database clear unarchived logfile group group_number;

  损坏的日志文档为当前活动日志文档:

  用命令清除相应的日志组:

  svrmgrl>alter database clear unarchived logfile group group_number;

  假如清除失败,则只能做基于时间点的不完全恢复。

  打开数据库并且用适当的方法进行数据库全备份:

  svrmgrl>alter database open;

  部分数据文档损坏:

  若损坏的数据文档属于非system表空间,则数据库仍然能够处于打开状态能够进行操作,只是损坏的数据文档不能访问。这时在数据库打开状态下能够单独对损坏的数据文档进行恢复。若是system表空间的数据文档损坏则数据库系统会异常终止。这时数据库只能以Mount方式打开,然后再对数据文档进行恢复。能够通过查看数据库日志文档来判断当前损坏的数据文档到底是否属于system表空间。

  非system表空间的数据文档损坏

  1. 确定损坏的文档名字:

  svrmgrl>select name from v$datafile where status=’INVALID’;

  2. 将损坏的数据文档处于offline状态:

  svrmgrl>alter database datafile ‘datafile_name’ offline;

  3. 从相应的备份结果集中恢复关于这个数据文档的最近的备份。对于没有采用带库备份的点能够直接从磁带上恢复;对于用带库备份的点用相应的rman脚本来恢复。

  4. 恢复数据文档:

  svrmgrl>alter database recover datafile ‘file_name’;

  5. 使数据库文档online:

  svrmgrl>alter database datafile ‘datafile_name’ online;

  6. 用适当的方法进行数据库全备份。

  system表空间的数据文档损坏:

  1. 以mount方式启动数据库

  svrmgrl>startup mount;

  2. 从相应的备份结果集中恢复关于这个数据文档的最近的备份。对于没有采用带库备份的点能够直接从磁带上恢复;对于用带库备份的点用相应的rman脚本来恢复。

  3. 恢复system表空间:

  svrmgrl>alter database recover datafile ‘datafile_name’;
 
  4. 打开数据库:

  svrmgrl>alter database open;

  5. 用适当的方法进行数据库全备份。

  表空间损坏:

  若非system表空间已损坏,则数据库仍然能够处于打开状态能够进行操作,只是损坏的表空间不能访问。这样在数据库打开状态下能够单独对损坏的表空间进行恢复。若是system表空间损坏则数据库系统会异常终止。这时数据库只能以Mount方式打开,然后再对表空间进行恢复。能够通过查看数据库日志文档来判断当前损坏的表空间是否是system表空间.

  非system表空间损坏:

  1. 将损坏的表空间处于offline状态:
 
  svrmgrl>alter tablespace ‘tablespace_name’ offline;

  2. 从相应的备份结果集中恢复关于这个表空间最近的备份。对于没有采用带库备份的点能够直接从磁带上恢复;对于用带库备份的点用相应的rman脚本来恢复。

  3. 恢复表空间:

  svrmgrl>alter database recover tablespace ‘tablespace_name’;

  4. 使表空间online:

  svrmgrl>alter tablespace ‘tablespace_name’ online;

  5. 用适当的方法进行数据库全备份.

  system表空间损坏:

  1. 以mount方式启动数据库

  svrmgrl>startup mount;

  2. 从相应的备份结果集中恢复system表空间最近的备份。对于没有采用带库备份的点能够直接从磁带上恢复;对于用带库备份的点用相应的rman脚本来恢复。

  3. 恢复system表空间:

  svrmgrl>alter database recover tablespace system;

  4. 打开数据库:

  svrmgrl>alter database open;

  5. 用适当的方法进行数据库全备份。

  整个数据库的任何文档损坏:

  整个数据库任何文档的损坏一般是在共享磁盘阵列发生无法恢复的灾难时才发生,这种情况下只能对数据库进行恢复。若数据库的归档目录也已丢失,则数据库不可能做完全恢复,会有用户数据的丢失。

  没采用带库备份的现场:

  1. 将最近的备份从磁带上把各个文档解包到相应的目录下。

  2. 以mount方式打开数据库:
 
  svrmgrl>startup mount;

  3. 恢复数据库:

  svrmgrl>recover database until cancel;

  4. 打开数据库:

  svrmgrl>alter database open resetlogs;

  5. 用适当的方法进行数据库全备份。

  采用带库备份的现场:

  1. 以nomount方式打开数据库:

  svrmgrl>startup nomount;

  2. 通过相应的rman脚本进行数据库软恢复。

  $rman cmdfile=hot_database_restore.rcv

  3. 打开数据库:

  svrmgrl>alter database open resetlogs;

  4. 用适当的方法进行数据库全备份。

  存在最近的数据库完整冷备份前提下的一些经典紧急情况的处理:

  数据文档,归档重作日志和控制文档同时丢失或损坏:

  无新增archives 时的状况:
 
  条件和假设:自上次映像备份以来尚未生成新的archive log(s); Archivelog Mode; 有同步的datafile(s) 和control file(s) 的映像(冷)拷贝

  恢复步骤:

  1. 将映像拷贝的datafile(s) 和control file(s) 抄送回原始地点:

  $ cp /backup/good_one.dbf /orig_loc/bad_one.dbf

  $ cp /backup/control1.ctl /disk1/control1.ctl

  2. 以mount 选项启动数据库:

  $ svrmgrl
 
  svrmgrl> connect internal

  svrmgrl> startup mount

  3. 以旧的control file 来恢复数据库:

  svrmgrl> recover database using backup controlfile until cancel;

  *** 介质恢复完成
  
  (必须马上cancel )

  4. Reset the logfiles (对启动而言不可省略):

  svrmgrl> alter database open resetlogs;

  5. 关闭数据库并做一次全库冷备份。

  新增archives 时的状况:

  条件和假设:自上次映像备份以来已生成新的archive log(s); Archivelog Mode; 有同步的datafile(s) 和control file(s) 的映像(冷)拷贝;archive log(s) 可用。

  恢复步骤:

  1. 假如数据库尚未关闭,则首先把他关闭:

  $ svrmgrl
 
  svrmgrl> connect internal

  svrmgrl> shutdown abort

  2. 将备份文档抄送回原始地点:

  任何Database Files

  任何Control Files(没有archive(s) 或redo(s) 的情况下,control files 的更新无任何意义)

  任何On-Line Redo Logs (Not archives)

  init.ora file(选项)

  3. 启动数据库:

  $ svrmgrl

  svrmgrl> connect internal

  svrmgrl> startup

  数据文档, 重作日志和控制文档同时丢失或损坏:

  条件和假设:Archivelog Mode; 有同步的任何所失文档的映像(冷)拷贝;archive log(s) 可用

  恢复步骤(必须采用不完全恢复的手法):
  
  1. 假如数据库尚未关闭,则首先把他关闭:

  $ svrmgrl

  svrmgrl> connect internal

  svrmgrl> shutdown abort

  2. 将备份文档抄送回原始地点:

  任何Database Files

  任何Control Files

  任何On-Line Redo Logs(Not archives)

  init.ora file(选项)

  3. 启动数据库然而并不打开:

  svrmgrl>startup mount

  4. 做不完全数据库恢复,应用任何从上次映像(冷)备份始积累起来的archives:

  svrmgrl> recover database until cancel using backup controlfile;

  ......
  ......

  cancel

  5. Reset the logfiles (对启动而言不可省略):

  svrmgrl> alter database open resetlogs;
 
  6. 关闭数据库并做一次全库冷备份。

  数据文档和控制文档同时丢失或损坏:

  条件和假设:Archivelog Mode; 有同步的datafile(s) 和control file(s) 的冷拷贝;archive log(s) 可用

恢复步骤:

  1. 将冷拷贝的datafiles(s) 和control file(s) 抄送回原始地点:

  $ cp /backup/good_one.dbf /orig_loc/bad_one.dbf

  $ cp /backup/control1.ctl /disk1/control1.ctl

  2. 以mount 选项启动数据库:

  $ svrmgrl

  svrmgrl> connect internal

  svrmgrl> startup mount
  
  3. 以旧的control file 来恢复数据库:

  svrmgrl> recover database until cancel using backup controlfile;

  *** 介质恢复完成

  (须在应用完最后一个archive log 后cancel )

  4. Reset the logfiles (对启动而言不可省略):

  svrmgrl> alter database open resetlogs;

  重作日志和控制文档同时丢失或损坏时:

  条件和假设:Control Files 全部丢失或损坏;Archivelog Mode; 有Control Files 的映像(冷)拷贝。
  
  恢复步骤:

  1. 假如数据库尚未关闭,则首先把他关闭:

  $ svrmgrl

  svrmgrl> connect internal

  svrmgrl> shutdown abort

  svrmgrl>exit

  2. 以Control File 的映像(冷)拷贝覆盖损坏了的Control File:

  $ cp /backup/control1.ctl /disk1/control1.ctl

  3. 启动数据库然而并不打开:

  $ svrmgrl

  svrmgrl> connect internal

  svrmgrl> startup mount

  4. Drop 坏掉的redo log (排除硬件故障):

  svrmgrl> alter database drop logfile group 2;

  5. 重新创建redo log:

  svrmgrl> alter database add logfile group 2 ’/orig_loc/log2.dbf’ size 10M;
  
  6. 以旧的control file 来恢复数据库:
  
  svrmgrl> recover database until cancel using backup controlfile;

  (必须马上cancel )

  7. Reset the logfiles (对启动而言不可省略):

  svrmgrl> alter database open resetlogs;

  8. 关闭数据库并做一次全库冷备份

  只发生归档重作日志丢失或损坏时:

  根据不同环境和情况,选择下述手段之一:

  a. 马上backup 全部datafiles (假如系统采用一般热备份或RMAN 热备份)

  b. 马上正常关闭数据库并进行冷备份(假如系统采用冷备份)

  c. 冒险前进!不做备份而让数据库接着跑,直等到下一个备份周期再做备份。这是在赌数据库在下一个备份周期到来之前不会有需要恢复的错误发生。

  注意:冒险前进的选择:假如发生错误而需要数据库恢复,则最多只能恢复到出问题archive log 之前的操作现场。从另一个角度讲,archive log(s) 出现问题时,数据库若无需恢复则其本身并没有任何问题。

  Oracle逻辑结构故障的处理方法:

  逻辑结构的故障一般指由于人为的误操作而导致重要数据丢失的情况。在这种情况下数据库物理结构是完整的也是一致的。对于这种情况采取对原来数据库的全恢复是不合适的,我们一般采用三种方法来恢复用户数据。
   
  采用exp/imp工具来恢复用户数据:

  假如丢失的数据存在一个以前用exp命令的备份,则能够才用这种方式。

  1. 在数据库内创建一个临时用户:

  svrmgrl>create user test_user identified by test;

  svrmgrl>grant connect,resource to test_user;

  2. 从以前exp命令备份的文档中把丢失数据的表按照用户方式倒入测试用户:

$imp system/manager file=export_file_name tables=(lost_data_table_name…) fromuser=lost_data_table_owner touser=test_user constraint=n;

  3. 用相应的DML语句将丢失的数据从测试用户恢复到原用户。

  4. 将测试用户删除:

  svrmgrl>drop user test_user cascede;
  
  采用logminer来恢复用户数据:

  Logminer是oracle提供的一个日志分析工具。他能够根据数据字典对在线联机日志、归档日志进行分析,从而能够获得数据库的各种DML操作的历史记录连同各种DML操作的回退信息。根据这些用户就能够将由于误操作而丢失的数据重新加入数据库内。

  1. 确认数据库的utl_file_dir参数已配置,假如没有则需要把这个参数加入oracle的初始化参数文档,然后重新启动数据库。下面例子中假设utl_file_dir=’/opt/oracle/db01’;

  2. 创建logminer所需要的数据字典信息,假设生成的数据字典文本文档为dict.ora:

svrmgrl>execute dbms_logmnr_d.build(dictionary_filename=>’dict.ora’, dictionary_location=>’/opt/oracle/db01’);

  3. 确定所需要分析的日志或归档日志的范围。这能够根据用户误操作的时间来确定大概的日志范围。假设用户误操作时可能的日志文档为/opt/oracle/db02/oradata/ORCL/redo3.log和归档日志’/opt/oracle/arch/orcl/orclarc_1_113.ora’。

  4. 创建要分析的日志文档列表,按日志文档的先后顺序依次加入:

  svrmgrl>execute dbms_logmnr.add_logfile(logfilename=>’/opt/oracle/arch/orcl/orclarc_1_113.ora’,options=>dbms_logmnr.NEW);

svrmgrl> execute dbms_logmnr.add_logfile(logfilename=>’ /opt/oracle/db02/oradata/ORCL/redo3.log’,options=>dbms_logmnr.ADDFILE);

  5. 开始日志分析,假设需要分析的时间在’2003-06-28 12:00:00’和’2003-06-28 13:00:00’之间:

  svrmgrl>execute dbms_logmnr.start_logmnr(dictfilename=>’ /opt/oracle/db01/dict.ora’,starttime=>to_date(’ 2003-06-28 12:00:00’,’YYYY-MM-DD HH:MI:SS’),endtime=>to_date(to_date(‘2003-06-28 13:00:00’,’YYYY-MM-DD HH:MI:SS’));

  6. 获取分析结果:

  svrmgrl>select operation,sql_redo,sql_undo from v$logmnr_contents;
 
  7. 根据分析结果修复数据。

  8.结束logmnr:

  svrmgrl>dbms_logmnr.end_logmnr;

  9. 用适当的方法对原数据库进行数据库全备份。利用备份恢复用户数据:

  采用这种方法时并不是在原数据库进行恢复,而是利用数据库备份在新的机器上重新建立一个新的数据库。通过备份恢复在新机器上将数据库恢复到用户误操作前,这样就能够获得丢失的数据将其恢复到原数据库。
                                 
  1. 在新的机器上安装数据库软件。

  2.  对于采用带库备份的现场,需要在新的数据库服务器上安装调试相应的备份管软件。

  3. 根据用户误操作的时间点进行基于时间点的数据库恢复操作。对于没有采用带库备份的现场,能够选取用户误操作前最近的备份磁带进行恢复;对于才用带库备份的点能够通过基于时间恢复点恢复的rman脚本来进行恢复。

  4.重新打开数据库:

  svrmgrl>alter database open resetlogs;

  5. 从新的数据库中获取丢失的用户数据,通过DML操作将其恢复到原数据库中。

  6. 用适当的方法对原数据库进行数据库全备份。

喜欢本文,那就收藏到:

    Del.icio.us Google书签 Digg Live Bookmark Technorati Furl Yahoo书签 Facebook 百度搜藏 新浪ViVi 365Key网摘 天极网摘 和讯网摘 博拉网 POCO网摘 添加到饭否 QQ书签 Digbuzz我挖网
相关评论  我也要评论
还没有关于此文章的相关评论!
  • 昵称: (为空则显示guest)
  • 评论分数: ★ ★ ★★★ ★★★★ ★★★★★
  • 评论内容:(不能超过250字,需审核后才会公布,请自觉遵守互联网相关政策法规。
  • 导航
    赞助商
    文章类别
    订阅