在生产环境,总会发生数据库的数据文件被误删除的事情,如sa不懂得数据库,数据库的在线日志为redo01.log,还是cp备份后删除的,让人哭笑不得,数据文件命名为无
在生产环境,总会发生数据库的数据文件被误删除的事情,如sa不懂得数据库,数据库的在线日志为redo01.log,还是cp备份后删除的,让人哭笑不得,数据文件命名为无dbf后缀等,都容易被误删除
在操作系统层面被误rm的,如果及时发现,还是可以挽救的,下面举例说明下:
1、查询数据库版本和是否归档模式
sql> select * from v$version;banner--------------------------------------------------------------------------------oracle database 11g enterprise edition release 11.1.0.7.0 - 64bit productionpl/sql release 11.1.0.7.0 - productioncore 11.1.0.7.0productiontns for linux: version 11.1.0.7.0 - productionnlsrtl version 11.1.0.7.0 - productionsql> archive log list;database log modearchive modeautomatic archivalenabledarchive destination/archivelogoldest online log sequence1next log sequence to archive 1current log sequence12、fly用户创建表fly,fly表的记录数为1128432
sql> conn fly/flyconnected.sql> create table fly as select * from dba_objects;table created.sql> insert into fly select * from fly;70527 rows created.sql> /141054 rows created.sql> /282108 rows created.sql> /564216 rows created.sql> commit;commit complete.sql> select count(*) from fly;count(*)----------11284323、查看fly用户默认表空间的数据文件,用操作系统命令rm删除fly用户默认表空间下的所有数据文件
sql> conn sys/oracle as sysdbaconnected.sql> select default_tablespace from dba_users where username='fly';default_tablespace------------------------------userssql> col file_name format a80sql> set linesize 200sql> select file_name from dba_data_files where tablespace_name='users';file_name--------------------------------------------------------------------------------/home/oracle/oradata/fly/datafile/users02.dbf/home/oracle/oradata/fly/datafile/user03.dbfsql> host rm /home/oracle/oradata/fly/datafile/users02.dbfsql> host rm /home/oracle/oradata/fly/datafile/user03.dbf4、在fly用户下创建表fly007,报错了,注意及时多执行几次创建表的sql语句,这边都只显示user02.dbf数据文件不存在了,接下来的恢复中,我们肯定要考虑到到底被误删除了几个数据文件
sql> conn fly/flyconnected.sql> create table fly007 as select * from dba_objects;create table fly007 as select * from dba_objects*error at line 1:ora-01116: error in opening database file 20ora-01110: data file 20: '/home/oracle/oradata/fly/datafile/users02.dbf'ora-27041: unable to open filelinux-x86_64 error: 2: no such file or directoryadditional information: 35、查看该文件是否仍旧被某些进程打开着
fly007:~ # lsof | grep /home/oracle/oradata/fly/datafile/users02.dbforacle 22297oracle 32uwreg8,2 209723392 1410008 /home/oracle/oradata/fly/datafile/users02.dbf (deleted)oracle 22301oracle 42ureg8,2 209723392 1410008 /home/oracle/oradata/fly/datafile/users02.dbf (deleted)oracle 22309oracle 30ureg8,2 209723392 1410008 /home/oracle/oradata/fly/datafile/users02.dbf (deleted)oracle 22317oracle 32ureg8,2 209723392 1410008 /home/oracle/oradata/fly/datafile/users02.dbf (deleted)6、数据库的dbwr进程会打开所有的数据文件,包括控制文件,查看dbwr进程的pid为22297
fly007:~ # ps -ef | grep dbw0 | grep -v greporacle 222971 0 21:21 ?00:00:00 ora_dbw0_fly
误删除数据文件恢复原理
当进程打开了某个文件时,只要该进程仍旧保持打开该文件,即使将该文件删除了,该进程仍然可以向打开该文件时提供给它的文件描述符进行读取和写入操作。在/proc 目录下,包含了反映内核和进程树的各种文件。/proc目录挂载的是在内存中所映射的一块区域,所以这些文件和目录并不存在于磁盘中,因此当我们对这些文件进行读取和写入时,实际上是在从内存中获取相关信息。大多数与lsof 相关的信息都存储于以进程的pid 命名的目录中,即/proc/1116 中包含的是pid 为1116的进程的信息。每个进程目录中存在着各种文件,它们可以使得应用程序简单地了解进程的内存空间、文件描述符列表、指向磁盘上的文件的符号链接和其他系统信息。lsof 程序使用该信息和其他关于内核内部状态的信息来产生其输出。所以lsof 可以显示进程的文件描述符和相关的文件名等信息。也就是我们通过访问进程的文件描述符可以找到该文件的相关信息。
当系统中的某个文件被意外的删除了,只要这个时候系统中还有进程正在访问该文件,那么我们就可以通过lsof从/proc目录下恢复该文件的内容
7、进入到dbwr进程的fd(文件描述符)目录下,需要确定被删除的数据文件是不是只有一个user02.dbf,结果发现不是的,10,25,32为fd(文件描述符)
fly007:~ # cd /proc/22297/fdfly007:/proc/22297/fd # ls -l | grep deletelrwx------ 1 oracle oinstall 64 dec 6 21:26 10 -> /home/oracle/product/11g/db/dbs/lkinstfly (deleted)lrwx------ 1 oracle oinstall 64 dec 6 21:26 25 -> /home/oracle/oradata/fly/datafile/user03.dbf (deleted)lrwx------ 1 oracle oinstall 64 dec 6 21:26 32 -> /home/oracle/oradata/fly/datafile/users02.dbf (deleted)fly007:/proc/22297/fd # ls -l /home/oracle/oradata/fly/datafile/user03.dbf/bin/ls: /home/oracle/oradata/fly/datafile/user03.dbf: no such file or directory