相关文章
友情链接

北亚数据恢复中心攻克HP EVA系列数据恢复难题

  本文档建立在针对 EVA的大量测试性研究基础上,所有的细节几乎均为对EVA的破译型研究,目前全球范围内尚未发现类似资料。

  北亚数据恢复中心(www.datahf.net)为研究HP EVA系列算法,投入了大量的人力物力,目前应为全国唯一的研究此项技术的公司.

  HP EVA4400/6400/8400因接近退役,已进入高故障区间,用户往往会认为花费几十万甚至上百万购买的eva系列应该是非常稳定的,但实际上无论多么昂贵的存储设备,使用的是相同或相似的。正如eva上销量极大的部件号为454414-001的1T FATA磁盘,其实就是臭名昭彰的希捷7200.11 系列的FC版,虽然前者正品售价仍高达近4K,后者却不足400,但两者的性能和稳定性表现几乎是相同的。这些1T FATA磁盘在经历2-3年的运行后,总会出现大批量的损坏,而且往往一旦损坏,几乎很难修复。一个我遇到的最夸张的案例,108块1T FATA的EVA6400,在半年内先后损坏50多块,这是让人惊讶的,实则也是正常的(缘于希捷这款产品的设计缺陷)。

  即便是使用15000rpm或10000rpm的FC磁盘,其实盘体也等同于希捷、等厂商的磁盘(目前的EVA系列磁盘已经全部基于SAS了,即使是FC,也是通过转换电路实现SAS到FC的转换,如671148-001)。EVA是的存储设备,平时数据会不断的迁移,加上应用通常较为繁重,所以磁盘的负载相对是较重的,也是很容易出现故障的。EVA是依靠大量磁盘的冗余空间,以及故障后rss冗余磁盘动态迁移来实现整个存储的数据保护,但随着越来越多的磁盘掉线,这种保护会接近临界,直至崩溃。

  通过eva command view下的 fieldservice执行强制激活命令,一则会导致cache dirty、数据块结构不一致导致数据出现损坏。二则修复只能建立在绕开坏道区域的基础上,如果坏道无法绕开,也是徒劳。

  另有一些情况:主机无法与扩展柜相连导致数据丢失,误删除vdisk等,也需要有切实的解决。

  HP P6000系列控制器与EVA系列内部算法完全相同,不再单独提及。

  【eva系列存储结构原理概述】

  北亚数据恢复中心

  电话:4006-505-808

  EVA系列存储是一款以虚拟化存储为实现目的的HP中高端存储设备,内部的结构组成完全不同于普通的基于简单的存储,EVA内部称之为VRAID。包括一些资深的HP工程师,对EVA的理解其实是有误区的(也可能是HP官方的宏观描述)

  EVA会对每个物理磁盘(简称为PV)进行签名(写在每个磁盘的0扇区),签名后即分配进不同的DISK GROUP。在disk group中,类似于aix 的卷管理,或HP LVM的卷管理一样,每个PV会按一定大小划分为若干存储单元(按AIX的说法,暂且称为PP吧),PP的大小为2的整数次幂,且应该在2-16M之间。

  每个PV中有有限数量的PP,这些PP合起来形成整个DISK GROUP的可用空间。所有的PV按5-15组成若干组RSS(HP的官方资料中讲最小的RSS磁盘数量是6,最大应不到15,但对底层的分析得知,存在5和15个PV的RSS情况),每个RSS就是一个所谓常规RAID的冗余组,但这个冗余组不等同于常规RAID,与常规RAID相似的是,常规RAID是以磁盘为单位的RAID算法,而RSS是基于PP的RAID算法。

  为提高性能,HP EVA会有倾向地轮流分配不同的RSS组,但这些RSS之间的数据存储是基于JBOD的(HP官方和很多资料上称是RAID0,或许是宏观的概念),每个RSS组成的stripe 的成员其实是不同PV中不同位置的PP。

  无论RSS中成员数量有多少个,对于VRAID5,一个stripe中的PV数总是5个。对于VRAID6,一个stripe中的PV数总是6个。例如,对于VRAID5,EVA会尽可能在N个磁盘中做C(N,5)的组合情况,以期实现IO 负载均衡。

  当一个RSS中某个PV离线,控制器会从同一个RSS组中其他磁盘(同带中已存在的PV之外)中寻找可用的PP,在逻辑上实现每个stripe的rebuild,从而保证整个存储的安全性。

  当一个RSS中损坏的磁盘数量足够少时(少于等于6个),这个RSS的安全性就非常低了,这时候,EVA会合并此RSS到另一个RSS中,这样可用的冗余空间就是共享的了,空间就可以从另一个较安全的RSS中迁移过来。

  为了保证有足够的空间提供冗余保护,在创建disk group时,EVA会提供一个Protection Level的保护级别,single表示用2个磁盘的空间做冗余,double表示用4个磁盘的空间做冗余。但这个冗余不同于hotspare,这个冗余空间仅会预留到每个PV的尾部,一则,多个磁盘,IO会更均匀,更快;二则,尾部的空间通常是质量较差的空间。

  【EVA系列常见故障】

  1、RSS中多个磁盘掉线,超过冗余保护级别。

  2、加入新磁盘,进行数据迁移时,新磁盘存在物理故障(此时无法回退,也无法前进)。

  3、VDISK 删除或EVA initialize。

  4、突发性主机与存储。无法discover到存储。

  【HP EVA数据恢复解决原理】

  eva系列最核心的结构部分来自于所有vdisk的运算pp表,这个pp map表会因为磁盘的不断迁移而迁移。所有的故障均可基于此map进行恢复。

  当pp map不存在时,根据不同的条带之间的冗余关系,可有优化算法对所有PP进行条带性集合,从而形成若干组正确的条带数据,再基于文件系统结构、数据结构等特征,重组若干条带。

  【数据恢复解决过程】

  北亚数据恢复中心

  电话:4006-505-808

  使用EVA扩展柜进行镜像的连接图如下:

  2、通过北亚frombyte recovery for hp eva程序进行vdisk重组,直接写入成镜像文件或目标物理磁盘。

  3、按常规方式解释镜像文件或目标磁盘,迁移镜像或导出内部文件。

  FROMBYTE Recovery for(全球唯一一款恢复Sybase的软件产品,已发行)

  FROMBYTE Recovery for(全球唯一一款恢复Mysql数据库的软件产品,即将发行)

  FROMBYTE Recovery for SqlAnywhere(全球唯一一款恢复SqlAnywhere数据库的软件产品,即将发行)

  FROMBYTE Recovery for InterBase(全球唯一一款恢复InterBase数据库的软件产品,即将发行)

  FROMBYTE Recovery for(产品即将发行)

  FROMBYTE Recovery for DHFS(全球唯一一款恢复大华监控录像全系列版本的软件产品,即将发行)

  FROMBYTE Reconstructor for(全球唯一一款针对Oracle数据库碎片恢复的软件产品,已发行)

  FROMBYTE Reconstructor for HP EVA(全球唯一一款针对EVA存储恢复的软件产品,即将发行)

  免费咨询电话:4006-505-808