数据恢复所涉及的不仅仅是各种软件,一旦遇到硬件故障,这就完全是硬件级的操作了。当硬盘的内部部件出现问题之后,一般需要对其进行维修或是更换,至少保证在很短的时间内能够工作,以便顺利读取数据,这也是硬件级数据恢复的指导思想。不过由于硬盘本身的精密度更高,因此要做到这一步可并不容易。
一、全面认识硬盘内部结构与工作原理
尽管在外部结构方面,各种硬盘之间有着一定的区别,但是其内部结构还是完全相同的,毕竟硬盘的本质工作方式不会改变。打开硬盘外壳之后,我们也就能够看到神秘的内部世界,其核心部分包括盘体、主轴电机、读写磁头、寻道电机等主要部件(图01)。不过需要提醒大家的是,千万不要随意打开硬盘的外壳,这将100%地使整个硬盘报废,因为硬盘的内部盘面不能沾染上一滴汇成,否则立即报废。一般硬盘内部结构维修甚至需要在要求极为严格的无尘实验室中进行。
1. 盘体(图02)
盘体从物理的角度分为磁面(Side)、磁道(Track)、柱面(Cylinder)与扇区(Sector)等4个结构。磁面也就是组成盘体各盘片的上下两个盘面,第一个盘片的第一面为0磁面,下一个为1磁面;第二个盘片的第一面为2磁面,以此类推……。磁道也就是在格式化磁盘时盘片上被划分出来的许多同心圆。最外层的磁道为0道,并向着磁面中心增长。事实上,硬盘的盘体结构与大家熟悉的软盘非常类似。只不过其盘片是由多个重叠在一起并由垫圈隔开的盘片组成,而且盘片采用金属圆片(IBM曾经采用玻璃作为材料),表面极为平整光滑,并涂有磁性物质。
2. 读写磁头组件(图03)
读写磁头组件由读写磁头、传动手臂、传动轴三部分组成。在具体工作时,磁头通过传动手臂和传动轴以固定半径扫描盘片,以此来读写数据。磁头是集成工艺制成的多个磁头的组合,采用非接触式结构。硬盘加电后,读写磁头在高速旋转的磁盘表面飞行,飞高间隙只有0.1~0.3μm,可以获得极高的数据传输率。新型MR(Magnetoresistive heads) 磁阻磁头采用读写分离的磁头结构,写操作时使用传统的磁感应磁头,读操作则采用MR磁头。
3. 磁头驱动机构
对于硬盘而言,磁头驱动机构就好比是一个指挥官,它控制磁头的读写,直接为传动手臂与传动轴传送指令。磁头驱动机构主要由音圈电机、磁头驱动小车和防震动机构组成。磁头驱动机构对磁头进行正确的驱动,在很短的时间内精确定位到系统指令指定的磁道上,保证数据读写的可靠性。一般而言,磁头机构的电机有步进电机、力矩电机和音圈电机三种,现在硬盘多采用音圈电机驱动。音圈是中间插有与磁头相连的磁棒的的线圈,当电流通过线圈时,磁棒就会发生位移,进而驱动装载磁头的小车,并根据控制器在盘面上磁头位置的信息编码来得到磁头移动的距离,达到准确定位的目的。
4.主轴组件(图04)
硬盘的主轴组件主要是电机轴承和马达,我们可以笼统地认为轴承决定一款硬盘的噪音表现,而马达决定性能。当然,这样说并不完全,但是基本上表达了这两项内容在硬盘中的重要地位。从滚珠轴承到油浸轴承再到液态轴承,硬盘轴承处于不断的改良当中,目前液态轴承已经成为绝对的主流市场。由于采用液体作为轴承,所以金属之间不直接摩擦,这样一来除了延长了主轴点解的寿命、减少发热之外,最重要一点是实现了硬盘噪声控制的突破。不过需要指出的是,采用液态轴承对于性能并没有任何好处,甚至反而会延长寻道时间。对于PC设备而言,似乎噪音与性能是一对永远难以平衡的矛盾。
二、 危险本源:硬盘的天生存储缺陷
与闪存类存储介质或是光存储介质所不同,带有磁头装置的硬盘在稳定性方面有着先天性的缺点,再加上本身就存在一定故障率的电路板,因此整个硬盘出现故障的概率可并不低。如果进行一个简单的归纳,硬盘的硬件损坏可以分为以下几类:
u 控制电路损坏:
是指硬盘的电路板中的某一部分线路断路或短路,或者某些电气元件或IC芯片损坏等等,导致硬盘在通电后盘片不能正常起转,或者起转后磁头不能正确寻道等。
u 磁头组件损坏:(图05,已经损坏的磁头组件)
主要指硬盘中磁头组件的某部分被损坏,造成部分或全部磁头无法正常读写的情况。磁头组件损坏的方式和可能性非常多,主要包括磁头磨损、磁头悬臂变形、磁线圈受损、移位等。
u 综合性损坏:
主要是指因为一些微小的变化使硬盘产生的种种问题。有些是硬盘在使用过程中因为发热或者其他关系导致部分芯片老化;有些是硬盘在受到震动后,外壳或盘面或马达主轴产生了微小的变化或位移;有些是硬盘本身在设计方面就在散热、摩擦或结构上存在缺陷。种种的原因导致硬盘不稳定,经常丢数据或者出现逻辑错误,工作噪音大,读写速度慢,有时能正常工作但有时又不能正常工作等。
u 扇区物理性损坏:
是指因为碰撞、磁头摩擦或其他原因导致磁盘盘面出现的物理性损坏,譬如划伤盘片、掉磁等。
用PC-3000修复硬盘故障
毫无疑问,控制电路损坏应当是这类故障中级别最低的,一般不会对数据造成危害。目前更换一块电路板已经是很容易的事情,毕竟主流硬盘的型号数量非常有限,一般专业硬盘维修店或是数据恢复服务商都能轻松解决这一问题。至于磁头组件损坏、综合性损坏和扇区物理性损坏,理论上是根本无法恢复的,只能通过一定的方法将其在短时间内快速读取数据,此时所能做的仅仅是数据恢复,而无法彻底修复硬盘。(图06,ISA版本的PC-3000硬件卡)
但是为何很多用户都或多或少听说过一些特殊的软件修理方法呢?其实这仅仅是针对一些硬盘缺陷方式的处理方法。为了减少硬盘返修的概率,硬盘厂商在硬盘内部设计了一个自动修复机制(Automatic Reallcation或 Automatic Reassign)。现在生产的硬盘都有这样的功能:在对硬盘的读写过程中,如果发现一个坏扇区,则由内部管理程序自动分配一个备用扇区来替换该扇区,并将该扇区物理位置及其替换情况记录在G-list(增长缺陷表,Grown defects list) 中。这样一来,少量的坏扇区有可能在使用过程中被自动替换掉了,对用户的使用没有太大的影响。
现在的硬盘密度越来越高,也极难做到100%的完美,硬盘盘面上或多或少存在一些缺陷。厂家在硬盘出厂前把所有的硬盘都进行低级格式化,在低级格式化过程中将自动找出所有defect track和defect sector,记录在永久缺陷列表(P-list,Permanent defect list)中。并且在对所有磁道和扇区的编号过程中,将skip(跳过)这些缺陷部分,让用户永远不能用到它们。这样,用户在分区、格式化、检查刚购买的新硬盘时,很难发现有问题。
当遇到硬盘没有明显的异响,而在操作系统中可以识别硬盘设备却无法在磁盘管理器中分配盘符时,很可能就是缺陷表故障,一般采用HDD Regenerator、MHDD、PC-3000和效率源等等这些软件可以修复。但是这类软件往往都有一定的局限性,表现为某一种软件针对某一型号的硬盘特别有效。我们在此以PC-3000为例向大家简单介绍。(图07,PC-3000针对固件的操作界面)
PC-3000是由俄罗斯著名硬盘实验室ACE Laboratory研究开发专业修复硬盘综合工具。PC-3000的基本工作原理是:掌握各种硬盘的专用CPU指令集,解读各种硬盘的Firmware(固件),控制硬盘的读写操作,实现硬盘内部参数的读写和硬盘内部管理程序的调用,最终达到以软件修复多种硬盘缺陷的目的。PC-3000由硬件部分和软件部分组成,硬件部分以专用于控制硬盘的测试卡为主;软件分为俄文版本和英文版本,其中包括若干个针对不同品牌不同系列的硬盘而开发的程序模块。(图08,PC-3000缺陷列表修改界面)
以目前最新的For Windows版PC-3000为例,进入之后选择相对应的硬盘品牌,然后可以根据自己的判断来确认究竟是硬盘P-list部分故障还是固件区故障,然后使用软件提供的固件备份系统进行覆盖。事实上,正版PC-3000用户都可以得到不断升级的固件支持以及一些相关参数,因此整个处理过程非常简单,仅仅是使用已经内置的几个操作选项而已。PC-3000的确非常强大,可以编辑固件和缺陷列表。一般来说,执行这些操作并不会破坏硬盘中的数据,因此的确可以作为有效的数据恢复方法。(图09,使用PC-3000读写硬盘固件)
硬盘里面还有另外一种封闭区域,又称为保留容量,它们其实是完全没有问题的好的盘面,但是因为某种原因被封闭起来了。譬如说一个硬盘是60GB,而磁碟的单碟容量为40GB,那么由两片磁碟构成的硬盘就必须封闭掉20GB的容量(磁碟的生产线都是一定的,厂商为了降低成本,都只会生产一种容量的磁碟,通过封闭不同容量的区域来获得不同的实际硬盘容量)。
弄清楚了硬盘的生产原理,那么厂商如何维修硬盘就很好理解了。对于控制电路、磁头等的损坏,就是应用最简单的替换法,换上新的零件就可以了。对于IC芯片的损坏,可以通过重写IC芯片的信息或者干脆替换IC芯片来修理。对于磁盘盘片的问题,情况就比较复杂。首先,厂商会用专门的仪器设备对硬盘的磁碟表面按照实际的物理地址重新进行全面的扫描,检查出所有坏的、不稳定的扇区,形成一个新的硬盘缺陷列表,然后把它写进硬盘的系统信息区,替换掉原来旧的硬盘缺陷列表。然后调用内部低级格式化程序,对硬盘进行内部格式化。程序会根据新的系统信息区信息,重新对所有的磁道和扇区进行编号、清零,重写磁道伺服信息和扇区信息。经过这样的处理,返修的硬盘就又可以像新的硬盘一样了。
有人可能会有疑问:既然有新的坏扇区加进系统保留区去了,那么硬盘的容量应该减少才对啊。其实这是不必担心的,我们上面提到过有另外一种被封闭区域,它们其实是完全没有问题的好的盘面。厂商的设备既然可以封闭新出现的坏扇区,当然也可以从被封闭的完好盘面上提取出相应的扇区容量来替代被封闭的坏扇区。现今的硬盘一般都有非常可观的保留容量,最少的也有好几个GB,大的可以达到20~30GB,甚至更多。
三、 硬件开盘处理方法:最后的必杀技
当排除硬盘是因为缺陷列表或是固件区的故障之后,其内部的故障就很让人担心了。无论是磁头缺陷,还是电机故障或是更为严重的盘片划伤,这些都需要进行开盘操作。所谓开盘操作,指的是在一定洁净度要求的空间内打开硬盘的盘腔,对其内部进行各种操作,以便找回数据。
深入了解超净间:参观XMHDD百级超净间
开盘操作对于很多第一次接触数据恢复的读者而言的确非常神秘,而且无论是使用的方法本身还是所要求的环境设备都非常新颖。为了解开大家的迷惑,我们在XMHDD数据恢复中心的配合下带领大家参观百级超净间,这也是开盘所必备的环境要求。(图10,XMHDD数据恢复中心百级超净间)
有些读者可能会提出这样的疑问,硬盘的工作环境需要达到十级洁净度,仅仅是百级超净间又如何符合要求呢?其实需要明确这样一个概念,十级洁净度是指硬盘长时间稳定工作所需要的环境。数据恢复过程仅仅是几十分钟,而且最终的目的并非是修复硬盘,而是找回丢失的数据,此时百级洁净度已经完全能够满足需求。XMHDD数据恢复中心曾经专门做过试验,结果证明十级洁净度与百级洁净度下的开盘成功率是一样的,而千级超净间则会存在比较严重的问题。
尽管千级甚至万级或是最普通的操作台也有可能开盘成功,但是此时的失误率实在太高,很容易造成无可挽救的二次破坏。对于数据恢复服务行业,做到对客户的数据负责是最基本的原则。此外,目前行业中存在对超净间的误解或是过于神化的现象。真正的超净间并非数据恢复服务商本身建造,需要委托专业的厂商专门定做,而能否达到要求则需要进行严格的检测。XMHDD在厦门建立的超净间通过厦门市计量局百级净化检测,完全达到百级洁净度,只有这样针对每一个超净间严格监控才能确保较高的开盘成功率。(图11,厦门市计量局百级净化检测仪器)(图ADD01,紫外线灯与过滤器)
在进入超净间之前,工程师必须穿戴专用的洁净服,否则辛苦建立的净化环境就要付诸东流。一般而言,联体式洁净服有着较好的效果,此时可以将全身包裹,不至于让人体皮屑污染环境。如果想要进一步提升效果,还必须安装风淋设备,工程师在进入超净间之前必须在风淋室内吹上几分钟,可以将吸附在身上的灰尘颗粒基本去除。风淋室可分为以下几种:单人单吹风淋室,单人双吹风淋室,单人三吹风淋室,双人双吹风淋室,XMHDD在厦门建立的超净间使用了效果一般的单人单吹风淋室,但是应对数据恢复百级净化应用已经绰绰有余了。一般而言,超净间内还有一个专用操作台,此时上下吹风方式可以进一步过滤尘埃。工程师的硬盘开盘操作完全在操作台内进行。(图12,风淋室去除衣服上的尘埃)
深入硬盘内部:开盘过程全展示
硬盘的密封都十分结实,但是只要使用六角螺丝刀也很好处理。分别拧下各个六角螺丝之后,就可以打开硬盘的上盖,此时也能清晰看到其内部结构(图13,专用的六角螺丝刀)。事实上,在打开硬盘之前,工程师一般都会凭借经验判断故障部位。如果在加电时没有听到硬盘转动声音且更换电路板后也没有效果,那么很可能是电机故障。而如果转动声音很正常且伴随着“咔哒”声,则多半是磁头偏移造成的划盘(此时应尽可能减少加电次数),需要更换磁头后才能恢复数据。(图14,打开硬盘后看到的盘体内部)
然而硬盘内部的这些配件并非完全通用,因此进行开盘操作时需要找到合适的备件,此时所要求的应该不仅仅是型号一样,甚至是Model号也完全一致。在更换磁头的时候,工程师首先将内部磁铁盖片掀开,此时需要用力得当,否则很容易弄伤盘片,从而导致数据彻底报废(图15,调整硬盘的磁头部分)。真正困难的还在于磁头的安放步骤。如果硬盘内部有多个盘片和磁头组成,那么留给工程师的操作空间就很小,此时稍不当心就可能触及盘片或是弄坏磁头。此外,不同型号的硬盘在磁头特性方面也不尽相同,这需要工程师凭借经验去调整距离。(图16,安装新的磁头)
目前XMHDD正在联合相关科研单位开发磁头调整辅助机械手,但是由于硬盘精密度较高,因此整个开发过程并不顺利,不过这将是未来开盘技术的发展方向:逐步摆脱纯手工操作方式。至于前几年业界流行的“盘片读盘机”传言,这几乎是不可能实现的。如果大家阅读本次专题的其它内容,就会了解硬盘的缺陷处理方式,因此指望像光盘驱动器那样来读取盘片简直是天方夜谈。