Dell服务器恢复案例

一,故障描述:

         厦门某光电生产厂商,使用Dell PowerEdge R710存储SQL Server数据库,服务器采用4SAS硬盘组建RAID54号盘作为热备盘,38日热备盘损坏,紧接着311RAID5中的一块盘损坏,进销存软件无法访问数据库,管理人员开始重启服务器,但是重启后一直卡在开机界面。于是管理员删掉RAID5,并重新使用前3快盘建立新的RAID5,完成后开机,出现NTFS自检,在执行约十几分钟的自检后进入系统。此时D盘内一个100GBSQL Server数据库无法附加,提示824错误,部分数据库的ldf文件变成了0KB。最近4天的bak文件也全部丢失。客户求助到本公司。

二,检测结果:

         接到硬盘后检测所有硬盘,发现4号盘已经出现物理故障,在扫描坏块时,硬盘会出现掉线的情况。前3块盘有2块盘出现不同程度的坏道,因此得出结论:

    1号盘最早出现故障,此时热备盘(4号)替代损1号盘,紧接着3号盘再次出现故障。服务器宕机(RAID5仅支持1块盘损坏后的自动恢复)

三,恢复过程:

         由于RAID5被重建,并做了同步操作,且参与重建的1号盘数据不新鲜,导致重建后的数据出现严重的逻辑错误,操作系统执行自动修复,导致数据被进一步破坏。虚拟重组RAID5后提取的MDF文件无法附加,修复后的MDF字段内出现逻辑错误。数据完全不可用。

四,恢复结果:

         进一步分析4号热备盘的数据,发现有7.8.9号这三天的bak文件,依次附加,8号和9号的bak文件也出现损坏,只有7号数据可以附加。客户表示可以接受,丢失的8-11号的数据由用户自己补录。至此数据恢复成功。
                             

五,后话:

         本案例中,如果损坏后不做任何操作,马上求助专业人士,数据恢复率可达100%。但由于重建RAID并同步的操作,导致数据严重损坏,加上NTFS文件系统的自检操作,更是火上浇油。由于热备盘没有加入到新建的RAID5,才使得数据有可恢复性。

    因此,也建议您在服务器出现故障时,第一时间求助专业人士,确定哪些操作会导致数据丢失,以免认为造成不可恢复。工程师电话:13459286608 谭云