CN1191518C - 用于分级存储管理系统的转换廉价磁盘冗余阵列 - Google Patents

用于分级存储管理系统的转换廉价磁盘冗余阵列 Download PDF

Info

Publication number
CN1191518C
CN1191518C CNB971819610A CN97181961A CN1191518C CN 1191518 C CN1191518 C CN 1191518C CN B971819610 A CNB971819610 A CN B971819610A CN 97181961 A CN97181961 A CN 97181961A CN 1191518 C CN1191518 C CN 1191518C
Authority
CN
China
Prior art keywords
data
data block
chunk
block
memory structure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CNB971819610A
Other languages
English (en)
Other versions
CN1247608A (zh
Inventor
戴维·阿伦·斯太克金司凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1247608A publication Critical patent/CN1247608A/zh
Application granted granted Critical
Publication of CN1191518C publication Critical patent/CN1191518C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/22Arrangements for sorting or merging computer data on continuous record carriers, e.g. tape, drum, disc
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2211/00Indexing scheme relating to details of data-processing equipment not covered by groups G06F3/00 - G06F13/00
    • G06F2211/10Indexing scheme relating to G06F11/10
    • G06F2211/1002Indexing scheme relating to G06F11/1076
    • G06F2211/1014Compression, i.e. RAID systems with parity using compression techniques

Abstract

本发明涉及用于分级存储管理系统的转换廉价磁盘冗余阵列,一个灵活的存储设备阵列存储多个数据块(903,905,907,909,911,913),这些数据块被分成了所谓数据条(901,1001)的数据块组,一个数据条中的每个数据块被存储在不同的设备上(401a-401f)。一个阵列控制器(403)支持依据不同存储器结构而独立格式化的数据条。具体地,最佳实施例中所支持的存储器结构是非冗余、镜像和奇偶性保护。每个存储数据块处于五种状态之一:“空”;“数据”;“奇偶性”;“备份”;或“自由”。阵列中存储数据块的每个数据条存在于七种状态之一,这七种状态取决于数据块的状态。定义了允许一种类型的数据条转换成另一种类型数据条的特定状态跃迁,使数据的移动最小化。

Description

用于分级存储管理系统的转换廉价磁盘冗余阵列
本发明一般涉及数字数据存储系统,特别涉及对通常被称为“廉价磁盘冗余阵列(RAID)”的独立存储设备冗余阵列的管理。
现代计算机系统的扩充数据存储需要大容量的海量数据存储设备。常用的存储设备是旋转式磁硬盘驱动器,其包括多个组成部分的复杂机械结构容易导致发生故障。一个典型的计算机系统包含多个这样的单元。一个存储单元的故障对系统来说是一个极具破坏性的事件。很多系统直到损坏的单元被修复或替换以及丢失的数据被恢复之后才能运行。
随着计算机系统变得更大、速度更快和更可靠,对存储设备的存储容量、速度和可靠性的需求也相应增加。简单叠加存储单元以增加存储容量将导致任一单元出现故障的概率相应增加。另一方面,只增大现有单元的大小而没有其它任何改进将导致速度的降低并对提高可靠性无益。
最近已考虑到用以提供数据冗余性等级的直接存取存储设备阵列。这种阵列通常被称为“RAID”(独立(或廉价)磁盘的冗余阵列)。在由Patterson、Gibson和Katz于1988年6月在ACM SIGMOD会议上发表的题为“A Case for Redundant Arrays of Inexpensive Disks(RAID)”的文章中,已经对提供不同形式的冗余性的各种类型的RAID进行了描述。Patterson等人分出了五种类型的RAID,其等级被分别指定为1到5。Patterson命名法已成为一种工业标准。
RAID的最初原理是用多个相对价廉的、小的磁盘驱动器来提供一个价格昂贵的大的磁盘驱动器的容量。而且较小的驱动器速度较快,因为它们能够同时读或写(“存取”)数据。另外,由于小驱动器的成本很低,所以可以还包括附加的(冗余)磁盘驱动器,从而结合特定的存储管理技术,当存储在一个小驱动器上的数据出现故障时,该磁盘驱动器允许系统恢复该数据。这样,RAID就能够允许增加后的容量、性能和可靠性。随着RAID在市场上得到认可,其使用并不仅限于小容量的驱动器,现在的RAID系统被配置以各种容量的驱动器。而且,RAID系统可由其它类型的存储设备构成,如光盘驱动器、磁带驱动器、软盘驱动器等。如这里所用,术语“RAID”和“RAID系统”不限于任何特定类型的存储设备。
利用Patterson命名法,RAID等级1为一种镜像配置。按照RAID-1存储器结构,每个数据单元被存储在位于一个阵列中的两个独立存储设备上。因此,如果一个设备发生故障,能够从第二设备上恢复数据。图1示出了按照RAID-1存储器结构存储的数据。如图1所示,存在设备1上的信息(A,B,C,D)镜像于设备2中(A′,B′,C′,D′)。同样地,存在设备3上的信息(E,F,G,H)镜像于设备4中(E′,F′,G′,H′),而存在设备5上的信息(I,J,K,L)镜像于设备6中(I′,J′,K′,L′)。
根据Patterson的命名法,RAID等级3及更高等级(RAID-3,RAID-4,RAID-5)将奇偶性记录用于数据冗余性。通过将存储在该阵列中不同存储单元的一个特定位置上的所有数据记录进行异或运算而得到奇偶性记录。换言之,在一个由N个存储单元构成的阵列中,位于一个存储单元上的一个特定位置的数据块中的每一位与其它(N-1)个存储单元中该位置上的每一位进行异或以生成一个由奇偶校验位构成的数据块;然后将该奇偶性数据块存储在剩余的(第N个)存储单元的该位置上。如果阵列中的任何存储单元发生故障,能够通过对位于剩余设备的同一位置上的数据块及其相应的奇偶性数据块进行异或而重新生成位于故障单元上任何位置处的数据。
在RAID-3中,不同磁盘驱动器上的所有读/写致动器一致动作以访问位于每个驱动器的同一位置上的数据。RAID-4和RAID-5的特征还在于独立地操作磁盘驱动器单元中的读/写致动器。换言之,一个磁盘驱动器单元上的每个读/写头可以自由存取磁盘任何位置上的数据,而与阵列中其它单元正在访问数据的位置无关。
按照RAID-4,信息被存储在“数据块”中,而每个数据块被存储在不同的存储设备中。在此文中,术语“数据块”是指一个由一个或多个扇区的数据构成的数据相关单元,可从一个存储设备单独访问该数据。包括这样一个RAID-4存储器结构的信息被称为一个“数据条”。每个数据条包括存在阵列中的几个设备202a-202f中的部分信息。在此文中,术语“数据条”是指一组数据块,其中每个数据块最好被存在与另一个存储设备中的另一个数据块地址相关的地址上,也可以包括一组数据块,其中每个(或一些)数据块被存在与被存在其它设备中的其它数据块的地址不相关的地址上。图2示出了按照RAID-4存储的4个数据条204a,204b,204c和204d。如图2所示,一个数据条204a包括一个存在设备1中的数据块201,一个存在设备2中的数据块203,一个存在设备3中的数据块205,一个存在设备4中的数据块207和一个存在设备5中的数据块209。另外,设备202f被用于存储奇偶性数据块211中的“奇偶性”信息。其它的每个设备用于存储用户信息。如果任何一个存储设备发生故障,则通过对存在其它每个设备中的数据条的保留信息进行逻辑异或来恢复存在故障设备中的信息。
在具有独立读/写能力(即RAID-4或RAID-5)的奇偶性保护磁盘阵列中所遇到的一个问题是在对一个数据块进行写操作的任何时候,与奇偶性数据块的更新相关的系统开销。例如,当改变设备1的数据块201中的信息(即,写入“新数据”以更新“旧数据”)时,通常对旧数据、来自奇偶性数据块211的旧奇偶性信息和新数据进行异或以产生更新后的奇偶性信息。新数据和新的奇偶性信息被写入它们各自的数据块中。这些操作可通过按照不同顺序的命令执行,但它们通常需要在每次更新数据时读两个数据块(旧数据和旧奇偶性信息)和写两个数据块(新数据和新奇偶性信息)。在利用高速缓存和其它技术克服此问题的同时,对一个RAID-4系统中的奇偶性磁盘存在过分使用的倾向。
在此作为参考引用的、被授予Clark等人的美国专利4,761,785描述了一种独立的读/写阵列,其中基本均匀地将奇偶性数据块分配给阵列中的磁盘存储单元。Patterson等人将这种类型的阵列指定为RAID-5。图3示出了一个RAID-5配置。将奇偶性数据块基本均匀地分配给阵列中的磁盘分担了更新奇偶性信息所造成的负担,从而避免了在将所有奇偶性记录保存在一个指定磁盘驱动器单元上时可能出现的潜在运行瓶颈,即使在RAID-5系统以及RAID-4系统中一般都使用相同的读-修改-写操作来写数据。RAID-5是Patterson所描述的最高等级的RAID。
每种不同的存储器结构格式都具有其自身的特性,这种特性使得该格式比其它任何格式都更适于存储特定的数据。同时,不存在一种公认为高级的格式。例如,从存储每个字节所花费的成本上看,RAID-1是最昂贵的,奇偶性保护格式的RAID较少,而非冗余存储则更少。非冗余存储与RAID-1通常比奇偶性保护格式速度更快,因为在奇偶性保护格式中更新数据的难度较大。奇偶性保护和镜像格式都是冗余的,但镜像格式更为坚固,因为即使两个存储设备都发生故障,只要发生故障的两个设备中存储了不同的信息,就可以恢复存储在这两个设备上的所有信息。例如,参照图1,如果设备1和设备3都发生故障,存储在这两个设备中的信息仍保留在设备2和4中。因此,能够恢复故障存储设备中的数据。但是,对于奇偶性保护配置来说,发生故障的两个设备中的所有数据都被丢失,因为奇偶性保护配置需要来自N-1个设备的可用信息以重构存储在一个故障设备中的信息,而N是RAID-4数据条中的设备总数。
由于在决定是否以一种特定的配置来组织信息时必须在速度、坚固性和所需空间之间进行权衡,所以能够将阵列的至少一部分指定为非冗余格式,一部分为镜像格式而另一部分为奇偶性保护格式将是非常有利的。动态地将一个阵列的一部分指定为一种格式或另一种格式(即来回将阵列的部分从一种格式转换成另一种格式)则是更加有利的。通过如下方式可以实现这种转换:首先将来自被重新格式化的阵列部分的所有数据复制到一个缓冲器(可位于阵列的内部或外部),然后重新格式化阵列的该部分并以新的格式反向复制数据。但是,将数据复制到一个缓冲器需要相当大的系统开销。
因此本发明的一个目的是提供一种用于在计算机系统中存储数据的增强方法及装置。
本发明的另一个目的是为计算机系统提供一种更灵活的存储子系统。
本发明的另一个目的是提供一种用于在计算机系统中管理存储设备的一个冗余阵列的增强方法及装置。
本发明的另一个目的是增强计算机系统的一个存储子系统被重构的能力以满足计算机系统用户的需求。
本发明的另一个目的是提供一种能够有效进行从RAID-1到RAID-4或RAID-5及反向转换的系统和方法。
一种灵活的数据存储装置包括一个能被格式化以支持用户需求的存储设备阵列。依据本发明的最佳实施例,阵列中的每个存储设备存储多个数据块,并且阵列的存储空间被分成多个被称为数据条的数据块组。一个阵列控制器支持独立依据不同存储器结构对数据条的格式化。具体地,最佳实施例中所支持的存储器结构为非冗余、镜像和奇偶性保护(RAID-4或-5)的。在使信息移动最小化的同时,镜像(RAID-1)信息的一个或多个数据条最好可被转换成RAID-4或RAID-5信息的等量个数据条,反之亦然。
依据最佳实施例,每个存储数据块存在于五种状态之一:(1)“空”;(2)“数据”;(3)“奇偶性”;(4)“备份”;或(5)“自由”。阵列中存储数据块的每个数据条存在于七种状态之一,这七种状态取决于数据块的状态。其中三种数据条状态为非冗余,两种为奇偶性保护,两种利用镜像结构。只有特别定义的状态跃迁是可行的。当在不危及用户信息的情况下,RAID控制器可改变一个存储设备的一个数据块中的信息(即所存储的信息既不是用户信息,也不是奇偶性信息,并且不用于生成奇偶性信息)时,该数据块最好被指定为一个“空”数据块。当一个数据块被保留用于存储用户信息时,该数据块最好被指定为一个“数据”块。当一个存储设备的一个数据块中所存储的信息是包含在同一数据条中的每个“数据”数据块的逻辑异或(“XOR”)结果时,该数据块最好被指定为一个“奇偶性”数据块。当一个存储设备的一个数据块中所存储的信息是同一数据条的另一个设备中的“数据”数据块所存储的信息的备份时,该数据块最好被指定为一个“备份”数据块。如果一个存储设备的一个数据块中当前没有存储用户信息,则该数据块最好被指定为一个“自由”数据块,但是必须按照RAID-4(5)读-修改-写的顺序变更存储在其中的信息,因为该信息被用于确定该数据条中一个相关“奇偶性”数据块的值。
按照RAID-1,存储每个数据块的两个备份;第一备份存储于第一存储设备,而第二备份存储于第二存储设备。一个数据块的第一备份最好被指定为一个“数据”数据块,而该数据块的第二备份最好被指定为一个“备份”数据块。依据最佳实施例,在“数据”数据块中的信息和“备份”数据块中的信息被存储在不同的存储设备上的同时,相关的“数据”和“备份”数据块被指定于同一数据条中。因此,RAID-1信息的一个数据条最好包括等量的“数据”和“备份”数据块,并且阵列中的存储设备个数最好为一个偶数。即,每个数据条可由来自阵列中每个设备的一个数据块组成。如果阵列中存储设备的个数为奇数,那么由于每个“数据”数据块需要一个相应的“备份”数据块,所以或者一个数据条包括来自少于存储设备个数的存储设备的数据,或者在每个数据条中有一个奇数据块。
依据最佳实施例,通过将RAID-1数据条中的任一个数据块指定为“奇偶性”数据块并改变特定的状态信息,一个处于完全镜像状态中的数据条被转换成奇偶性保护状态(RAID-4或-5)。在这种情况下不需要移动数据。
在从非冗余或奇偶性保护状态转换到完全镜像状态时,状态表定义了转换规则,借以允许进行转换。必须有足够的未使用空间(“空”或“自由”状态)来生成一个与该数据条中每个“数据”数据块相关的“备份”数据块。由于RAID-1信息的“数据”数据块及其相关的“备份”数据块最好存在于同一数据条中,如果存在将被转换的数据条(“转换”数据条)中的信息需要占用多于一半的数据条容量,则必须将至少一部分信息移到另一个数据条中以便为与剩余的“数据”数据块相关的“备份”数据块让出空间。如果信息所移至的数据条(“接收”数据条)是按照RAID-1配置的,则每个接收数据条必须具有足够的空间来存储“数据”数据块及其相关的“备份”数据块。可替换地,一些数据可被移到一个奇偶性受保护或未受保护的接收数据条中,在这种情况下,在接收数据条中只需有足够的空间来存储数据。对“数据”数据块进行备份并更新数据条状态。
参照附图能够更好地理解本发明的结构和操作,在附图中,相同的附图标记代表相同的部件,其中:
图1示出了按照现有的RAID-1结构存储的数据;
图2示出了按照现有的RAID-4结构存储的数据;
图3示出了按照现有的RAID-5结构存储的数据;
图4示出了依据本发明最佳实施例的RAID系统;
图5A,5B和5C描述了依据最佳实施例用以与数据块的状态和使用相映射的数据结构;
图6是依据最佳实施例用以执行向与一个RAID控制器相连接的存储设备写数据的流程图;
图7是示出了依据最佳实施例的数据块的数据条中可能的状态变化的状态图;
图8是依据本发明的一个实施例,用以执行将当前被格式化为镜像结构(RAID-1)的阵列部分转换成奇偶性保护结构(RAID-4或-5)的流程图;
图9示出了依据最佳实施例的一个阵列900,其中一个数据条901被格式化为RAID-1结构;
图10示出了依据最佳实施例在将图9中RAID-1结构的数据条转换成奇偶性保护数据条之后的图9所示的阵列;
图11是示出了依据最佳实施例将一个奇偶性保护数据条(RAID-4或-5)转换成镜像结构(RAID-1)的方法流程图;
图12是示出了依据最佳实施例将一个非冗余数据条转换成奇偶性保护数据条(RAID-4或-5)的方法流程图;以及
图13示出了依据本发明的另一个实施例的具有奇数个存储设备的阵列。
首先参照图4,示出了一个依据本发明最佳实施例的可重新配置的RAID存储系统。在现有的RAID配置中,最佳实施例中的RAID系统400包括多个存储设备401a-401f。在最佳实施例中,存储设备401a-401f为直接存取存储设备(DASD),具体为旋转式磁硬盘驱动存储设备,应当理解也可以使用其它类型的存储设备取而代之。应当理解,虽然为方便起见在图4中示出了6个DASD,但依据本发明的阵列可由三个或三个以上设备构成。一个RAID控制器403与DASD401a-401f相耦合。依据本发明的一个实施例,RAID控制器403包括随机存取存储器410和可编程微处理器412。存储器410的一部分或全部是非易失性的,以便进一步减少数据丢失的可能性。处理器412执行一个控制程序412,该程序控制阵列的操作,具体地说就是按照这里所述的方法控制存储设备组从一种格式向另一种格式的转换。如图所示,控制程序413驻留在存储器410中,但它也可以驻留在一个单独的控制存储存储器中,如一个只读存储器(ROM)芯片。可从一个任意的独立外设,如磁盘、磁带、光盘等中将控制程序装入存储器410中,或从主机系统404下载控制程序。控制器403最好从主机系统404接收命令和信息。主机系统404可以是任何能够与现有的RAID系统相耦合的设备,包括被编程的通用数字计算机在内。命令指示控制器403将所接收的与该命令有关的信息存储到DASD阵列中。另外,这些命令还指出是按照非冗余格式还是按照RAID-1、-4或-5格式存储该信息。可替换地,控制器403在没有主处理器引导的情况下确定是非冗余地还是按照RAID-1、-4或-5格式存储所接收的信息。
控制器403可通过一条总线与DASD阵列耦合。但是,在最佳实施例中,提供了允许同时向一个以上DASD传送数据的连接。依据本发明的一个实施例,任意的外部存储器405,如一个磁带阵列也可以与控制器403耦合。磁带阵列允许控制器将不经常使用的信息移出DASD阵列以便释放DASD阵列中的空间。可选择地,外部存储器405可以是一个被用作用于写数据的临时高速缓存的DASD,如由DavidA.Styczinski于92年5月6日申请的题目为“用于操作存储设备阵列的方法和装置”、申请号为No.07/879,621的未决申请所述。
在本发明的最佳实施例中,或者使用RAID-4格式,或者使用RAID-5格式,但是不能同时使用两种格式。但是,在另一个实施例中,控制器403可以按照RAID-1、-4或-5格式中的任一种来存储信息。所属技术领域的技术人员应当理解控制器403必须知道向每个配置分配阵列的哪一部分。例如,如果分配阵列的一部分用于按照RAID-1存储信息而分配阵列的一部分用于按照RAID-5存储信息,则控制器403必须知道哪部分被分配给哪种格式。
存储器410中的数据目录411记录如何使用阵列的不同部分。数据目录411存储阵列中数据块的当前状态,即每个数据块是一个“数据”、“备份”、“奇偶性”还是“自由”数据块,以及用于每个数据条的数据冗余形式(镜像、奇偶性保护或非冗余)。数据目录411可以存储附加信息以及用于确定阵列各部分用途的信息。为了能够在掉电或部件故障的情况下进行恢复,最好在别处(例如,在一个DASD的指定位置上或在独立的外设406上)有一个数据目录411的冗余备份(图中未示出),和/或将数据目录411存在RAM410的一个非易失部分中。
图5A,5B和5C示出了依据最佳实施例而用于上述目的的数据目录411中的三种数据结构。图5A示出了一个数据条状态表,图5B示出了一个数据块状态表,而图5C示出了一个主机地址映象表。数据条状态表501包含多个项,每一项包含一个数据条地址字段502和一个数据条状态字段503。数据条地址字段502存储数据条的数据块在存储设备上的起始地址。在最佳实施例中,所有数据块的大小相同并且一个数据条的所有数据块在每个存储设备中分别具有相同的地址;因此一个起始地址标识足以标识整个数据条。数据条状态字段503包含该数据条的当前状态;下面将参照图6详细描述可能出现的状态。
数据块状态表521包含多个项,每一项对应于一个数据块。数据块状态表521中的每一项包含数据条标识字段523,设备ID字段524,状态字段525,版本号字段526和配对设备字段527。数据条ID字段523标识包含有数据块的数据条,并且可以是一个例如指向数据条状态表501中相应项的指针。设备ID字段524包含一个包含该数据块的DASD标识符。由于对任一个DASD来说,每个数据条包含不多于一个的数据块,所以关于数据条和DASD的说明足以对任何数据块进行规定。状态字段525记录数据块的使用状态(“数据”,“备份”,“奇偶性”,“自由”或“空”)。版本号字段526记录一个版本号。版本号随每次数据更新而加1,并用于确定冗余数据块是否同步。配对设备字段527标识用于存储设备的一个镜像数据块的配对数据块或用于奇偶性保护数据块的奇偶性数据块。配对设备字段可以是例如一个指向与配对/奇偶性数据块相对应的数据块状态映象表项的指针,或是一个设备标识符。
主机地址映象表541将主机地址与数据块相映射。依据最佳实施例,一个主计算机系统将存储子系统视为一个大范围的地址。来自主机的用于对一个特定地址进行读或写的命令必须被翻译成涉及一个存储设备ID和该存储设备中的地址,通过主机地址映象表541实现该命令。映象表541包含多项,每一项对应于一个由主机系统编址的数据块。每一项包含一个主机系统地址字段542和一个数据块标识字段543,数据块标识字段包含一个指向用以标识该数据块的数据块表521中的一项的指针。
应当理解上述数据结构只是为了以一个实施例为例进行说明,也可以使用各种不同的数据结构。例如,对于一个跟踪数据块的物理位置的主计算机系统来说,在RAID控制器403中可以不必包括一个主机地址映象表。数据结构可以由一个大表构成,如链接表或其它形式。另外,根据实施的恰当方式,一些字段可能是不必要的,也可能需要一些其它字段。应当理解上述数据结构不是RAID控制器403所使用的唯一数据结构。例如,控制器403最好具备一个在存储设备上分配可用的自由空间列表;这不仅包括具有“自由”或“空”状态的数据块,还包括“数据”数据块的未分配部分。
在正常操作中,控制器403响应从主计算机系统404接收的数据访问命令(读或写数据)。来自主机404的一个数据访问命令包含被读的一个数据块(或其一部分,如一个扇区)的地址。来自主机的地址被用于访问主机地址映象表541中的一项。数据块标识字段543指向数据块表521中与该数据块相对应的项。控制器访问该项以便从字段524中得到一个存储设备标识符并从字段523中得到一个数据条标识符。这些标识符标识了被读的数据块。然后控制器403在传送存储设备中所需数据的地址的同时,向对应的存储设备发送一个读命令。
写操作更为复杂,因为(a)控制器403必须确定数据块当前的使用状态,以及(b)一次写操作可导致数据条状态的改变。图6是在执行一次写操作时RAID控制器403所执行的流程图。响应于来自主机404的写命令,控制器403参考表501、521和541以便确定如上所述用于读操作的存储设备ID和所需数据块的地址(步骤601)。另外,控制器还从表501的数据条状态字段503中确定数据条的当前状态(步骤602)。
下面将参照图7详细描述可能出现的状态及状态跃迁。根据数据条的当前状态,分成三种可能情况。如果当前状态是未受保护状态中的任一种(标号5,6,7),控制器403在传送数据在应写入存储设备中的地址的同时,只向对应的存储设备发送一个写命令(步骤605)。
如果当前状态是镜像状态的一种(标号1和2),控制器403首先向包含该镜像数据的对应存储设备发送一个写命令(步骤610)。然后控制器403使包含该镜像数据的数据块的版本号字段526加1(步骤611)。然后控制器403从配对设备字段527中找到包含该镜像数据备份的设备的设备ID,并向包含该备份的存储设备发送一个写命令(步骤612)。在完成的同时,使包含该备份的数据块的版本号字段526加1以便与包含原始数据的数据块的版本号相等(步骤613)。
如果当前状态是奇偶性保护状态的一种(标号3和4),控制器403首先从包含该数据的存储设备中读出该数据(步骤620),将该数据与将被写入的新数据进行异或以便生成一个临时变更掩码(步骤621),将新数据写入存储设备并使版本号字段加1(步骤622)。然后控制器403从配对设备字段527中得到包含奇偶位的设备标识符,从奇偶性设备中读出旧的奇偶性数据块(步骤625),将这个旧的奇偶性数据与变更掩码进行异或以便生成新的奇偶性数据(步骤626),将新的数据写入奇偶性数据块(步骤627),并使该奇偶性数据块的版本号加1。
然后控制器403确定一个数据块的状态是否发生了任何变化。即,如果数据已被写入一个状态为“自由”或“空”的数据块中,则数据块的状态必须改变成“数据”(步骤630)。如果数据块的状态发生了变化,则数据条的状态也可能发生变化。因此控制器确定数据条的状态是否发生了变化,并更新状态字段503以便反映出这种变化(步骤631)。以后将参照图7对可能的变化和引发这些变化的事件进行描述。
应当理解为了便于理解起见,对图6中所示的关于上述读和写操作的描述进行了简化,并且对理解本发明起非关键性作用的其它操作可随读或写操作执行。特别是,控制器403可具备一个用于提高性能的驻留超高速缓冲存储器并且在这种情况下,在从和/或向一个存储设备读写之前,通常要检查该超高速缓存的内容。可替换地,控制器403可采用一个外部记录设备来对写操作进行临时缓存。
除了能够以RAID-1、-4或-5格式存储所接收的信息以外,最佳实施例的控制器403还能够重新分配阵列,使得其中已按照一种RAID格式存有信息的阵列部分被重新分配成另一种RAID格式。例如,被分配按照RAID-1存储信息的阵列部分可被重新分配成按照RAID-5存储信息。然后按照RAID-5对存储在该阵列部分中的信息进行重新格式化。
为了支持阵列部分从一种RAID格式向另一种格式的转换,每个数据条与一种状态(存储在表501中)相关,并且根据预定的事件而允许发生预定的状态变化。导致状态改变的事件一般为特定的数据写操作、对自由空间的特定请求(即删除一个现存数据块中的数据)和对改变数据条的RAID格式的请求。图7是示出了可用状态和可能状态变化的状态图。
七种状态被定义如下:
1.“新镜像”:此状态隐含写入该数据条的数据还具有一个写入该数据条中的镜像备份。但是这个数据条中的至少一个数据块为“空”。
2.“完全镜像”:此状态隐含该数据条中的所有数据都是镜像的并且此数据条中不存在“空”数据块。
3.“奇偶性X”:此状态隐含该数据是受奇偶性保护的(例如,RAID-4或RAID-5),但具有足够的“自由”和“奇偶性”数据块来支持所有“数据”空间的备份。
4.“完全奇偶性”:此状态隐含该数据是受奇偶性保护的,但不具有足够的“自由”和“奇偶性”数据块来支持所有“数据”数据块的备份。
5.“未被保护”X:此状态隐含该数据是未被保护的,但是具有足够的“空”数据块用于所有“数据”数据块的备份。
6.“未被保护”:此状态隐含该数据是未被保护的,且不具有足够的“空”数据块用于所有“数据”数据块的备份,但具有一个用作奇偶性数据块的“空”数据块。
7.“完全未被保护”:此状态隐含该数据是未被保护的,并且不存在“空”数据块。
图7中示出了下述可能的状态跃迁:
1a此跃迁发生在数据被写入但在数据条中仍存在至少一个“空”数据块时。
1b此跃迁发生在作为一次写操作的结果,此数据条中不再存在一个“空”数据块(即,数据被写入最后一个现在已变为“数据”数据块的“空”数据块中)时。作为将参照图8详细说明的二级跃迁(从状态1到状态2,再到状态3)的一部分,这种变化还可发生在用于将数据条格式变为奇偶性保护的命令中;在这种情况下,“空”数据块与备份配对并且它们的状态都变为“自由”。
1c此跃迁只发生在用于改变数据条格式的命令中,以便为存储数据生成更多空间。在这种跃迁中,数据条中状态为“备份”的所有数据块都变为“空”状态。
2a此跃迁发生在数据被写入一对“自由”数据块中(导致状态变为“数据”和“备份”)时。还可发生在用于释放一个数据块内的空间的命令中。在后一种情况下,该数据块的备份都被指定为“自由”(表示可用)并且其镜像不受干扰。
2b此跃迁只发生在用于改变数据条格式的命令中。以后将参照图8详细描述关于此状态变化的过程。
2c此跃迁只发生在用于改变数据条格式的命令中。在此跃迁中,所有的“备份”数据块变为“空”状态。
3a此跃迁发生在数据被写入一个“自由”数据块中,从而使状态变为“数据”(下面3b中所述的情况除外)时。还可发生在用于释放一个数据块内的空间的命令中,从而使该数据块的状态变为“自由”。
3b此跃迁发生在数据被写入一个“自由”数据块中,从而使状态变为“数据”(下面3b中所述的情况除外)时,并且其结果是不再剩有足够的“自由”和“奇偶性”数据块用以备份该数据条中的所有“数据”数据块。
3c此跃迁只发生在用于改变数据条格式的命令中。以后将参照图11详细描述关于此状态变化的过程。
3d此跃迁只发生在用于改变数据条格式的命令中。以后将参照图11详细描述关于此状态变化的过程。
3e此跃迁只发生在用于改变数据条格式的命令中。所有的“奇偶性”和“自由”数据块都被变为“空”,使它们可用于存储其它数据。
4a此跃迁发生在数据被写入一个“自由”数据块中时或一个用于释放一个“数据”数据块内的自由空间的命令使该数据块变为“自由”,但在该数据条中不再具有足够的“自由”和“奇偶性”数据块用以支持所有“数据”数据块的备份(启动向镜像状态的跃迁)时。
4b此跃迁发生在一个“数据”数据块被变为“自由”并且其结果是现在具有足够的“自由”和“奇偶性”数据块来支持所有“数据”数据块的备份之后。
4c此跃迁只发生在用于改变数据条格式的命令中。所有的“奇偶性”和“自由”数据块都被变为“空”。
5a此跃迁发生在数据被写入一个“空”数据块,从而使其状态变为“数据”时,或发生在用于释放一个“数据”数据块内空间的命令使该数据块从“数据”变为“空”时,在任一种改变之后,都有足够的“空”数据块来支持所有“数据”数据块的备份(启动向镜像状态的跃迁)。
5b如后所述,此跃迁只发生在用于改变数据条格式的命令中。
5c如后所述,此跃迁只发生在用于改变数据条格式的命令中。
5d此跃迁发生在数据被写入一个“空”数据块中,从而使“空”数据块的状态变为“数据”时,并且其结果是不再具有足够的“空”数据块来支持所有“数据”数据块的备份。
5e如后所述,此跃迁只发生在用于改变数据条格式的命令中。
6a此跃迁发生在数据被写入一个“空”数据块,从而使其状态变为“数据”时,或发生在一个用于释放一个“数据”数据块内空间的命令使该数据块从“数据”变为“空”时,在任一种改变之后,只有一个“空”数据块用于奇偶性校验而没有足够的“空”数据块来支持所有“数据”数据块的备份。
6b此跃迁发生在一个用于释放一个“数据”数据块内空间的命令使该数据块从“数据”变为“空”并且其结果是现在具有足够的“自由”和“奇偶性”数据块来支持所有“数据”数据块的备份时。
6c如后所述,此跃迁只发生在用于改变数据条格式的命令中。
6d此跃迁发生在数据被写入最后一个“空”数据块,从而使其状态变为“数据”时,使得不再具有“空”数据块。
7a此跃迁发生在一个用于释放一个“数据”数据块内空间的命令使该数据块从“数据”变为“空”时。
如上所述,某些跃迁“依命令”而发生以便改变数据条格式。控制器403最好根据来自主机404的命令来配置数据条。主机不记录单个数据条的配置而只知道镜像配置中的特定存储量、奇偶性保护配置中的特定存储量以及未受保护(即非冗余)配置中的特定存储量。控制器403通过为每种配置分配适量的数据条来响应来自主机404的初始配置命令。然后,无论主机404何时写入新数据,它规定该数据是将被镜像、奇偶性保护还是不受保护。控制器403根据此规定选择一个适当的数据条和数据块。由于主机404发现它需要一种具有更多空间的不同配置,主机404可改变配置,例如以释放出更多空间。在这种情况下,主机404将向控制器403发送一个配置命令,请求重新配置一定的存储量(数据条的数量)。控制器根据数据条的当前状态选择一个适当的数据条进行重新配置。控制器403最好选择其中至少已具有一定量数据的数据条。例如,如果从主机404接收到一个命令,用于将一个数据条从未受保护状态转换成奇偶性保护状态:与跃迁6(c)相比,更优选跃迁5(c);在处于同一状态中的多个数据条之间,优选具有最多“空”数据块的数据条;以及在具有等量“空”数据块的数据条之间,优选在部分“数据”数据块中具有最多未用空间的数据条(假设部分数据块可被分配)。
应当理解可替换地,主机404将数据块与设备和地址进行映射并(通过或不通过用户输入)确定以哪种方式配置哪些数据条。在这种情况下,控制器403仅仅响应用于改变一个数据条的配置的主机命令。可替换地,按照某种预定算法或条件,控制器403可自身决定改变配置。作为另一替换例,用户可直接向控制器403输入配置变化。关于“依命令”而发生用以改变配置的特定跃迁的描述不仅不构成对那些由主机初始化的配置变化的限制,而且还可包括由控制器本身、用户或通过其它方法产生的“命令”。
图8是依据最佳实施例,用以将当前格式化为RAID-1结构的阵列部分转换成RAID-4(5)结构时所执行的流程图。换言之,一个数据条的状态从状态2变为状态3(或处于从状态1到状态2再到状态3的二级跃迁)。在这个实施例中,阵列由偶数个存储设备构成,且一个数据条由每个存储设备的一个数据块构成,一个数据条的每个数据块位于每个相应存储设备的相同地址范围内。图9示出了用于实现图8所示方法的阵列900。应当注意按照RAID-1格式化的信息通常不存储在一个数据条中。即,按照RAID-1组织的信息只需要将该信息的备份驻留在阵列中的另一个存储设备中。反之,依据本发明,  指定RAID-1存储结构中的数据块以形成一个“数据条”,该数据条具有与所转换成的RAID-4或RAID-5数据条相同的维数。应当注意最好将一个数据条中的数据块存储在不同DASD内的相关地址上,例如存储在与存储于其中的第一数据块相关的每个DASD内的相同地址上。但是,在本发明的另一个实施例中,一个数据条内的每个数据块可被存储在与其它数据块地址无关的地址上。为简洁起见,在一个数据条是一个RAID-4数据条或RAID-5数据条的情况下,将该数据条记为“RAID-4(5)”。图10示出了在图9中所示的RAID-1数据条901被转换成RAID-4(5)数据条1001之后的阵列900。本发明利用下述观测值。一个与其本身进行异或的数据块将产生一个全为零的数据块。即:
            (A)XOR(A)=0            (EQ1)
由于图9和10所示实施例中的一个RAID-1数据条由三对数据块构成,每对数据块包括一个数据块和该数据块的一个备份,在任意五个数据块之间进行异或操作的结果是产生一个与第六数据块相等的数据块。即:
(A)XOR(A′)XOR(B)XOR(B′)XOR(C)=(C′)  (EQ2)
其中A′是A的一个精确备份,B′是B的一个精确备份,而C′是C的一个精确备份。
假设五个数据块中的两个是五个数据块中的另两个的备份,则上述关系式将保持真值而与哪五个数据块被异或无关。因此,如图10所示,只需将一个RAID-1数据条中的一个数据块913从“备份”改为“奇偶性”并将其它“备份”数据块905和909中的每一个改为“自由”,该RAID-1数据条就能够转换成一个RAID-4(5)数据条。可以看出对被指定为“奇偶性”数据块的特定数据块的选择将确定该数据条被构造成一个RAID-4还是一个RAID-5数据条。显然,从其本身来说,在一个RAID-4或RAID-5数据条之间是没有区别的,因为它是“奇偶性”数据块在每个用以区分RAID-4与RAID-5系统的数据条中的相对位置。
如图8所示,转换过程的第一步是标识一组将被转换的数据块(步骤801)。在最佳实施例中,每个数据条能够被个别和独立地从RAID-1配置转换成RAID-4(5)配置,反之亦然。由于每个数据条最好由位于每个DASD上的一个特定地址范围内的所有数据块构成,所以仅通过指定该地址范围或指定其中一个数据块即可选择一个数据条。但是,标识一个要转换的数据条的步骤也可涉及其它事情。例如,如果一个数据条由位于彼此无关的混合地址上的数据块构成,则一个数据条的识别就可能涉及选择单独的RAID-1数据块对。可替换地,可将一个存储设备阵列设计成只能选择预定义的数据条组(例如一个包括多个数据块的大地址范围),或将存储设备阵列设计成只在整个阵列上执行转换。用户可手动执行该识别过程或通过依据某些算法的软件来执行该识别过程(例如选择最近使用过的数据条)。转换算法假设已完成了所有的未决写操作,即每个“数据”及其各自的“备份”数据块具有相同的数据。这可通过检查其版本级来进行验证。如果一个写操作还没有完成(版本级不匹配),则在开始处理之前完成该写操作。
依据最佳实施例,有两种镜像状态,分别标识为状态1(“新镜像”)和状态2(“完全镜像”)。只允许进行从状态2向奇偶性保护状态(状态3,“奇偶性X”)的状态跃迁。因此,如果该数据条处于状态1,则必须将其首先转换成状态2(跃迁1b)以便于最终向“奇偶性X”状态跃迁,如步骤802中的分支所示。为了使一个处于“新镜像”状态中的数据条变为“完全镜像”状态,必须对“空”数据块进行镜像,即必须将存在一个“空”数据块中的任何内容镜像到另一个“空”数据块中。如果预先知道所有“空”数据块都为零,则已经满足条件。否则,完成此过程的最简单方式就是通常使“空”数据块置零(可替换地,也可彼此配对和与所作的数据备份配对)(步骤803)。然后“空”数据块的状态就变为“自由”并且该数据条的状态变成“完全镜像”(步骤804)。
利用处于状态2(“完全镜像”)中的数据条,选择一个DASD以便存储与新的RAID-4(5)数据条相关的奇偶性数据块(步骤806)。在图9和10中,示出了选择数据块913,应当理解其它数据块已经被选择。在最佳实施例中,控制器403按照一种用于奇偶性数据块的预定映射算法而自动选择一个奇偶性数据块。即,在最佳实施例中,按照RAID-5构造奇偶性,并通过一个简单的循环公式来确定奇偶设备的个数,例如((N-1)*S MOD N)+1,其中S为数据条个数而N为阵列中存储设备的个数。但是,应当理解还可通过用户、主机来执行对适当奇偶性数据块的选择或隐含于其它判别式中。例如,如果指定了RAID-4,则包含奇偶性的DASD为已知,因此从该数据条的识别中可以知道包含奇偶性的数据块。也可以先选择该奇偶性数据块,并根据该奇偶性数据块的选择而默认适当的数据条。因此可以按照不同的顺序执行步骤801-806,或同时执行特定的步骤。
将所选定的用于存储奇偶性数据的数据块913指定为“奇偶性”数据块(步骤807)。通过指定这是一个奇偶性数据块,应当理解由于已经在系统中进行了一些记录,从而系统能够如此识别和对待该数据块。在最佳实施例中,更新数据块表521的数据块状态字段525中的数据块状态以便反映出所选定的数据块是一个奇偶性数据块,即,表521中的数据块状态变为“奇偶性”。
如果已被指定为“奇偶性”数据块913的数据块以前是一个“数据”数据块(步骤808),则指定与该“数据”数据块相关的“备份”数据块为一个“数据”数据块(步骤809)。然后将剩余的每个“备份”数据块指定为一个“自由”数据块(步骤810)。最后,指定的数据条从“完全镜像”(状态2)变为“奇偶性X”(状态3)(步骤812)。如上所述,最佳实施例中的“指定”意味着改变数据块表521中的数据块状态和数据条状态表501中的数据条状态,应当理解也可以用其它形式表示这种信息。
从等式EQ2可以看出存储在“奇偶性”数据块913中的信息等于数据条1001内的其它每个数据块903-911的异或值,因此不必通过后面的异或操作来计算奇偶性。另外,由于两个数据块905和909被指定为“自由”,所以在从RAID-1转换成RAID-4(5)之后,可以在数据条1001中存储其它信息。
图11是将一个奇偶性保护或非冗余数据条(即“转换数据条”)转换成一个镜像数据条(RAID-1)的方法流程图。为了将一个数据条转换成完全镜像状态,在转换数据条中必须有足够的可用空间以存储每个“数据”数据块的备份。具体地参照图7所示的状态图,从状态3(“奇偶性X”)或状态5(“未被保护”X)向状态2(“完全镜像”)的状态跃迁是可能的。这就是图7所示的跃迁3d和5b。图10示出了一个处于“奇偶性X”状态下的转换数据条1001,该数据条能够被转换成“完全镜像”状态。如果该数据条处于状态4,6或7,则在进行完全镜像之前,该数据条必须首先变成状态3或状态5,如下所述。因此,在将信息存入一个奇偶性保护或未受保护数据条中时,最好在将任何信息存入位于第二DASD内的第二数据块之前,将第一数据块存入第一DASD。以这种方式,信息被合并并且不一定以一种方式进行合并,以便使必需的空间可用。
如图11所示,转换的第一步是识别将被转换的数据块组,即转换数据条(步骤1101)。如前所述,在最佳实施例中,每个数据条能够被个别和独立地从一种配置转换成另一种配置。可以通过上述图8所示的任一种方法来进行识别。
然后系统验证在该数据条中是否存在足够的未用空间来创建每个“数据”数据块的“备份”数据块。具体地,控制器403参照数据条状态表501来确定数据条状态;状态3或状态5下的一个数据条具有足够的未用空间(步骤1102)。如果在转换数据条中没有足够的空间来存储所需的“备份”数据块(即,该数据条处于状态4,6或7),则必须将至少一部分数据从转换数据条重新定位到另一个数据条或另一个存储子系统中,例如重新定位于相关的磁带驱动器405中(参看图4)。图11中的步骤1103-1106示出了这个过程。该系统首先确定是否能够释放一个“数据”数据块中的存储空间(步骤1103)。例如通过询问用户该数据块中的数据是否能被覆盖、压缩或存储于别处,并由用户进行选择来执行该步骤。可替换地,可对控制器403编程以便为数据可重新定位于其上的数据块扫描可用的其它数据条,压缩可被压缩的数据或为重新定位于磁带而选择数据块等,从而自动地重新定位数据块。控制器403可利用最近常用的算法来确定对哪个数据块进行压缩和/或重新定位。如果不能释放其中一个“数据”数据块,则该过程异常中断且不能转换该转换数据条(步骤1106)。如果找到一个合适的候选数据块,则在适当的时候重新定位/压缩/忽略该数据块中的数据,并释放该数据块本身以存储其它数据(步骤1104)。控制器403将状态表521中的数据块状态改为“自由”(如果数据条处于状态4,则变为“完全奇偶性”)或“空”(如果数据条处于状态6或7,则变为“未被保护”或“完全未被保护”),并更新数据条状态(步骤1105)。数据块状态的改变可引发数据条状态变为状态3或状态5。然后重复步骤1102的算法。
如果该数据条已经处于状态3或5,或能被转换成上述任一种状态(步骤1102的“是”分支),则控制器403首先将该数据条中的所有“数据”数据块读入RAM410(步骤1108)。在“数据”数据块被读入RAM410中时,它们排入已部分完成,即已写入“数据”但还没有“备份”的写操作队列中。控制器403通过将“空”、“自由”和“奇偶性”数据块的状态改为“备份”并将适当的项置入配对设备字段527中来更新数据块表521(步骤1109)。只有在数据块被读入RAM且数据块状态被映射之后,数据条状态才变成“完全镜像”(步骤1110)。然后控制器403通过将数据从RAM写到“备份”数据块中来完成排队等候的操作(步骤1112)。以这种方式,在一个DASD发生故障而转换过程仍然继续的情况下,一个从奇偶性保护状态转换到镜像状态的数据条保持了冗余度。
图12是将一个非冗余数据条(即“转换数据条”)转换成一个奇偶性保护数据条(RAID-4或-5)的方法流程图。为了将一个数据条转换成奇偶性保护状态,在转换数据条中必须具有一个可用的未用数据块来存储奇偶性。具体参照图7所示的状态图,从状态5(“未被保护”X)到状态3(“奇偶性X”)或从状态6(“未被保护”)到状态4(“完全奇偶性”)的状态跃迁是可能的。这就是图7所示的状态跃迁5c和6c。如果该数据条处于状态7,则该数据条必须在被奇偶性保护之前变成状态6,如后所述。
步骤1201到1206与上述步骤1101-1106相似。如图12所示,转换的第一步是识别将被转换的数据块组,即转换数据条(步骤1201)。如前所述,每个数据条能够被个别配置并且可以通过上述图8所示的任一种方法来进行识别。
然后系统验证在该数据条中是否存在一个未用数据块以便存储奇偶性信息。具体地,控制器403参照数据条状态表501来确定数据条状态;状态5或状态6下的一个数据条具有足够均未用空间(步骤1202)。如果在转换数据条中没有足够的空间来存储所需的PATIRY数据块(即,该数据条处于状态7),则必须如上述图1所述释放一个数据块。系统确定是否能够释放一个“数据”数据块中的存储空间(步骤1203);如果不能,则处理过程异常中断(步骤1206)。如果找到一个合适的候选数据块,则在适当的时候重新定位/压缩/忽略该数据块中的数据,并释放该数据块本身以存储其它数据(步骤1204)。控制器403将状态表521中的数据块状态改为“空”,并更新数据条状态(步骤1205)。“空”数据块的创建使数据条状态从状态7变成状态6。然后重复步骤1202的算法。
如果该数据条已经处于状态5或6,或能够如上所述被转换成状态6(步骤1202的“是”分支),则控制器403首先选择一个用于存储奇偶性信息的数据块(步骤1208)。可通过上述图8所述的任一种方法执行此步骤。但是,如果选择了一个“数据”数据块,则该数据块中的数据将不得不被重新定位到一个“空”数据块中。因此,最好选择一个可用的“空”数据块。如果存在多于一个的“空”数据块,则通过适当的算法来选择这样一个“空”数据块。然后控制器连续读取数据条中除了被选择用以存储奇偶性信息的数据块以外的所有数据块,并产生所读取数据块的一个累积异或值(步骤1209)。这个累积异或值被暂时存储在RAM410中。当所有数据块已被读出时,所产生的累积异或值即为奇偶性信息。然后将这个奇偶性信息写入所选定的“奇偶性”数据块中(步骤1210)。然后控制器403通过将奇偶性数据块的状态改为“奇偶性”、将任意“空”数据块的状态改为“自由”,并在适当的时候更新配对设备字段527来更新数据块状态表521(步骤1211)。然后控制器在适当的时候将表501中的数据条状态改为“奇偶性X”或“完全奇偶性”(步骤1212)。并设置版本号以反映出奇偶性信息当前有效。
在最佳实施例中,阵列中的存储设备个数为偶数,并且每个数据条由位于每个存储设备的特定地址范围上的所有数据块构成。这种排列简化了数据条与确定奇偶性数据块之间的映射关系。但是,也可以利用一个具有奇数个存储设备的阵列。在这种情况下,一个数据条最好由少于存储设备个数的偶数个数据块构成。例如,一个数据条中的数据块个数为N-1,其中N是存储设备的个数。图13示出了这样一种配置。在图13的阵列中,标记为“数据”IA、“备份”1A、“数据”1B和“备份”1B的数据块(1301-1304)构成了一个数据条,而例如标记为“数据”3A、“备份”3A、“数据”3B和“备份”3B的数据块(1305-1308)构成了第二数据条。应当注意每个数据条包含偶数个数据块,但这些数据块并非都位于相同的地址上。利用上述技术可将这样一个数据条转换成RAID-4(5)格式或反向转换。对数据目录表的某些改动是必要的,以便处理更复杂的数据条映射。
可替换地,如果一个数据块已知为“空”且包含的数据全部为零(如果一个“空”数据块的内容未知或非零,则将零写入该数据块中以满足条件),则可以利用改进的上述技术将一个包含了奇数个数据块的数据条从RAID-1转换成RAID-4(5)。这种情况可能出现在例如将一个新的DASD加入到现有的阵列中时。在这种情况下,通过(a)选择一个奇偶性数据块(可以是空数据块)并将其指定为“奇偶性”数据块,(b)如果选定的数据块是一个“备份”数据块,则指定其它每个“备份”数据块和“空”数据块为“自由”;(c)如果选定的数据块是一个“数据”数据块,则指定相关的“备份”数据块为一个“数据”数据块,并指定所有其它“备份”数据块和“空”数据块为“自由”;以及(d)如果选定的数据块是“空”数据块,则指定每个“备份”数据块为“自由”,可以将一个选定的数据条转换成RAID-4(5),其中该数据条包含按照RAID-1配置的一对或多对数据块以及一个空数据块。相似地,可以利用剩余的一个未配对数据块(作为一个“自由”数据块或作为一个为防止存储设备故障而未受保护的“数据”数据块)进行向RAID-1的反向转换。
依据本发明的最佳实施例,通过一个RAID控制器来执行“自由”、“备份”、“数据”或“空”数据块的指定。RAID控制器可以是一个可编程设备,例如一个用于PC服务器的IBM SSA RAID适配器,一个PC ServeRAID SCSI适配器,或一个AS/400高级系统模型300中的磁盘单元控制器,其中每种设备都是由国际商业机器公司生产制造的。可替换地,该控制器可以是一个状态机、专用硬件或一个ASIC(专用集成电路)。可替换地,可通过运行于实际上系统的通用中央处理器上的软件来执行由一个存储子系统的专用RAID控制器所执行的功能,所述中央处理器除了RAID控制器功能之外还可执行其它各种任务。
依据最佳实施例,特别指定每个数据块以便确定新数据是否能被写入该数据块中,并且如果能,则确定是否必须按照读-修改-写的算法写入新数据。所属技术领域的技术人员应当理解也可利用其它的指定方法来达到相似的结果,并且每个数据块的指定也可用于与本发明无关的其它目的。
一个用于存储设备阵列的控制程序可作为存储在一个计算机程序产品上的处理器可执行指令序列而执行,所述计算机程序产品包括磁软盘、磁带、光盘、集成电路芯片或可编程计算机可读的其它存储设备。
依据最佳实施例,一组RAID-1配置的数据块可被转换成RAID-4或RAID-5配置,反之亦然。但是,应当理解也可以使用具有相似特性并与RAID级数或其它限定无关的其它配置。特别是指6级以上的工业识别RAID级。一般地,这些系统具有RAID-4或5级的全部特性,但还具有诸如双重奇偶性数据块或附加备用数据块之类的其它特性。
图1、2、3、9、10和13示出了存储设备阵列,阵列中的每个设备包含相对较少的数据块。选择数目较少的数据块只是为了进行说明,而不应将本发明限定在任何特定的数目上。虽然本发明是通过利用较少数目的数据块而实现的,但所属技术领域的技术人员应当理解存储设备阵列中的每个存储设备实际上可包括很多个数据块。
虽然前述的用于将一个数据条从一种格式转换成另一种格式的特定系统和方法能够完全达到本发明的目的,但应当理解这只是本发明的一个最佳实施例并且只代表本发明所广泛关注的主题,本发明的保护范围包括对所属技术领域的技术人员来说是显而易见的其他实施例,因此除了后述的权利要求以外,不能对本发明进行任何限定。

Claims (24)

1.一种用于将存储在多个数据存储设备上的第一存储器结构转换成存储在所述多个数据存储设备上的第二存储器结构的方法,该方法包括步骤:
(a)识别将被转换的数据块组,其中每个数据块被分别存储在所述多个数据存储设备的不同个上,所述数据块组包括多个数据块对,每个数据块对中的两个数据块具有相同的数据;
(b)选择所述数据块组的一个第一数据块;
(c)将第一数据块指定为一个奇偶性数据块,而不改变包含在所述第一数据块中的数据;
(d)从不包括所述第一数据块的所述数据块组中的每个数据块对中分别选择一个数据块;以及
(e)将从不包括所述第一数据块的所述数据块组中的每个数据块对中分别选择的每个数据块指定为可用于存储替换数据。
2.如权利要求1所述的方法,其特征在于所述数据块组包括一个数据条,其中每个数据块被存储在各数据存储设备中的相同地址上。
3.如权利要求1所述的方法,
其中每个所述数据存储设备存储多个所述数据块,所述多个数据存储设备包含多个所述数据块组;以及
其中可将第一数据块组从所述第一存储器结构转换成所述第二存储器结构,而第二数据块组保持按照所述第一存储器结构而配置。
4.如权利要求3所述的方法,其特征在于可个别和独立地将每个数据块组从所述第一存储器结构转换成所述第二存储器结构。
5.如权利要求1所述的方法,其特征在于所述第一存储器结构是按照RAID-1配置的数据块组,而所述第二存储器结构是按照RAID-4或RAID-5配置的数据块组。
6.如权利要求1所述的方法,
其中第一存储器结构包括多个“备份”数据块和“数据”数据块,每个“备份”数据块是一个相关的“数据”数据块的备份并且每个“备份”数据块被存储在一个与存储相关“数据”数据块的DASD不同的DASD上,第二存储器结构包括一个奇偶性数据块和一组奇偶性保护数据块,每个奇偶性保护数据块被存储在一个与存储奇偶性数据块和其它每个奇偶性保护数据块的DASD不同的DASD上;
其中如果所述第一数据块是一个“备份”数据块,则所述用于将从不包括所述第一数据块的所述数据块组中的每个数据块对中分别选择的每个数据块指定为可用于存储替换数据的步骤包括指定每另一个“备份”数据块为一个“自由”数据块;以及
其中如果所述第一数据块是一个“数据”数据块,则所述用于将从不包括所述第一数据块的所述数据块组中的每个数据块对中分别选择的每个数据块指定为可用于存储替换数据的步骤包括(1)指定与第一数据块相关的“备份”数据块为一个“数据”数据块,以及(2)指定每另一个“备份”数据块为一个“自由”数据块。
7.如权利要求1所述的方法,其特征在于所述数据存储设备是旋转式磁硬盘驱动器。
8.一种数据存储系统,包括:
多个数据存储设备;
一个可编程处理器,用于控制所述多个数据存储设备的操作,所述可编程处理器执行一个控制程序以将存储在所述多个存储设备上的第一存储器结构转换成存储在所述多个存储设备上的第二存储器结构;
其中所述控制程序维护用于所述数据存储系统的状态信息;以及
其中所述控制程序,响应对将被转换的数据块组的识别,其中将被转换的数据块组中的每个数据块被分别存储在所述多个数据存储设备的不同一个上,所述数据块组包括多个数据块对,每个数据块对中的两个数据块具有相同的数据,
(a)更新所述状态信息以将所述数据块组的一个第一数据块指定为一个奇偶性数据块,而不改变包含在所述第一数据块中的数据,以及
(b)更新所述状态信息以将从不包括所述第一数据块的所述数据块组中的每个数据块对中分别选择的每个数据块指定为可用于存储替换数据。
9.如权利要求8所述的数据存储系统,其特征在于所述可编程处理器被包含在一个与主计算机系统相连的控制器中,所述控制器包括一个包含所述状态信息的随机存取存储器。
10.如权利要求8所述的数据存储系统,其特征在于所述第一存储器结构是按照RAID-1配置的数据块组,而所述第二存储器结构是按照RAID-4或RAID-5配置的数据块组。
11.如权利要求8所述的数据存储系统,其特征在于所述数据存储设备是旋转式磁硬盘驱动器。
12.如权利要求8所述的数据存储系统,其特征在于所述数据块组包括一个数据条,其中每个数据块被存储在各数据存储设备中的相同地址上。
13.如权利要求8所述的数据存储系统,
其中每个所述数据存储设备存储多个所述数据块,所述多个数据存储设备包含多个所述数据块组;以及
其中所述控制程序将第一数据块组从所述第一存储器结构转换成所述第二存储器结构,而第二数据块组保持按照所述第一存储器结构而配置。
14.如权利要求13所述的数据存储系统,其特征在于所述控制程序能够个别和独立地将每个数据块组从所述第一存储器结构转换成所述第二存储器结构。
15.如权利要求8所述的数据存储系统,其特征在于所述控制程序自动地根据对将从所述第一存储器结构转换成所述第二存储器结构的数据块组的识别而选择所述第一数据块。
16.一种用于控制一个数据存储系统的控制器,所述数据存储系统具有多个用于存储数据的数据存储设备,所述控制器包括:
一个可编程处理器,用于控制所述多个数据存储设备的操作,所述可编程处理器执行一个控制程序以将存储在所述多个存储设备上的第一存储器结构转换成存储在所述多个存储设备上的第二存储器结构;以及
一个随机存取存储器,用于包含由所述控制程序维护的状态信息;
其中所述控制程序,响应对将被转换的数据块组的识别,其中将被转换的数据块组中的每个数据块被分别存储在所述多个数据存储设备的不同一个上,所述数据块组包括多个数据块对,每个数据块对中的两个数据块具有相同的数据,
(a)更新所述状态信息以将所述数据块组的第一数据块指定为一个奇偶性数据块,而不改变包含在所述第一数据块中的数据,以及
(b)更新所述状态信息以将从不包括所述第一数据块的所述数据块组中的每个数据块对中分别选择的每个数据块指定为可用于存储替换数据。
17.如权利要求16所述的控制器,其特征在于所述第一存储器结构是按照RAID-1配置的数据块组,而所述第二存储器结构是按照RAID-4或RAID-5配置的数据块组。
18.如权利要求16所述的控制器,
其中每个所述数据存储设备存储多个所述数据块,所述多个数据存储设备包含多个所述数据块组;以及
其中所述控制程序将第一数据块组从所述第一存储器结构转换成所述第二存储器结构,而第二数据块组保持按照所述第一存储器结构而配置。
19.如权利要求18所述的控制器,其特征在于所述控制程序能够个别和独立地将每个数据块组从所述第一存储器结构转换成所述第二存储器结构。
20.一种用于将存储在多个数据存储设备上的第一存储器结构转换成存储在所述多个数据存储设备上的第二存储器结构的方法,该方法包括步骤:
(a)识别将被转换的数据块组,其中所述数据块组中的每个数据块被分别存储在所述多个数据存储设备的不同一个上,所述数据块组包括多个包含数据的数据块和一个包含从所述多个包含数据的数据块中得出的奇偶性的一个第一数据块;
(b)选择包含奇偶性的所述数据块以包含所述多个包含数据的数据块中的第一数据块中所包含的数据备份,而不改变包含在所述第一数据块中的数据;
(c)选择所述数据块组中的第一子集,所述第一子集具有除所述奇偶性数据块以外的至少一个数据块,以包含所述数据块组的第二子集中所包含的数据的备份,所述第二子集具有除所述多个数据块中的所述第一数据块以外的至少一个数据块,而不改变包含在所述第二子集中的数据;以及
(d)指定从所述数据块组中选定的每个数据块可用于存储所述数据块组中另一个数据块所包含的数据备份。
21.一种数据存储系统,包括:
多个数据存储设备;
一个可编程处理器,用于控制所述多个数据存储设备的操作,所述可编程处理器执行一个控制程序以控制所述数据存储系统的操作;
其中所述多个数据存储设备中的数据被组织成多个数据块组,所述数据块组中的每个数据块被分别存储在所述多个数据存储设备的不同个上;
其中所述控制程序支持依据多种不同存储器结构的所述数据块组的格式化,所述至少一种存储器结构为冗余数据格式,第一数据块组和第二数据块组的格式化可彼此独立;以及
一个随机存取存储器,用于存储由所述控制程序维护的状态信息,所述状态信息包括用于每个数据块的数据块状态和分别用于所述第一数据块组和所述第二数据块组的组状态,所述组状态信息包括对配置每个数据块组所依据的存储器结构的标识;
其中所述控制程序,响应对将从第一存储器结构转换成第二存储器结构的数据块组的标识,
(a)更新用于将被转换的所述数据块组中的数据块的数据块状态信息,以及
(b)更新用于所述数据块组的组状态信息,以识别按照第二存储器结构配置的数据块组。
22.如权利要求21所述的数据存储系统,其特征在于所述第一存储器结构是按照RAID-1配置的数据块组,而所述第二存储器结构是按照RAID-4或RAID-5配置的数据块组。
23.如权利要求21所述的数据存储系统,其特征在于所述每个数据块组包括一个数据条,其中每个数据块被存储在各数据存储设备中的相同地址上。
24.如权利要求21所述的数据存储系统,其特征在于所述状态信息包括分别用于所述多个数据块组中的每个数据块组的组状态,所述多个数据块组中的每个数据块组彼此单独和独立地按照各自的存储器结构而配置。
CNB971819610A 1997-02-27 1997-05-28 用于分级存储管理系统的转换廉价磁盘冗余阵列 Expired - Lifetime CN1191518C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/805,652 US5960169A (en) 1997-02-27 1997-02-27 Transformational raid for hierarchical storage management system
US08/805,652 1997-02-27

Publications (2)

Publication Number Publication Date
CN1247608A CN1247608A (zh) 2000-03-15
CN1191518C true CN1191518C (zh) 2005-03-02

Family

ID=25192126

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB971819610A Expired - Lifetime CN1191518C (zh) 1997-02-27 1997-05-28 用于分级存储管理系统的转换廉价磁盘冗余阵列

Country Status (6)

Country Link
US (1) US5960169A (zh)
JP (1) JP3266277B2 (zh)
KR (1) KR100321843B1 (zh)
CN (1) CN1191518C (zh)
TW (1) TW436689B (zh)
WO (1) WO1998038568A1 (zh)

Families Citing this family (149)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6571314B1 (en) * 1996-09-20 2003-05-27 Hitachi, Ltd. Method for changing raid-level in disk array subsystem
US6098119A (en) * 1998-01-21 2000-08-01 Mylex Corporation Apparatus and method that automatically scans for and configures previously non-configured disk drives in accordance with a particular raid level based on the needed raid level
US6173415B1 (en) * 1998-05-22 2001-01-09 International Business Machines Corporation System for scalable distributed data structure having scalable availability
US6611897B2 (en) 1999-03-22 2003-08-26 Hitachi, Ltd. Method and apparatus for implementing redundancy on data stored in a disk array subsystem based on use frequency or importance of the data
US6378038B1 (en) * 1999-03-31 2002-04-23 International Business Machines Corporation Method and system for caching data using raid level selection
US6742137B1 (en) * 1999-08-17 2004-05-25 Adaptec, Inc. Object oriented fault tolerance
US6594724B1 (en) * 2000-03-30 2003-07-15 Hitachi Global Storage Technologies Netherlands B.V. Enhanced DASD with smaller supplementary DASD
US6571310B1 (en) 2000-04-20 2003-05-27 International Business Machines Corporation Method and apparatus for managing a heterogeneous data storage system
KR100364895B1 (ko) * 2000-06-12 2002-12-16 아라리온 (주) 데이터 액세스 제어 방법 및 시스템
US6529997B1 (en) * 2000-08-11 2003-03-04 Storage Technology Corporation Apparatus and method for writing and reading data to and from a virtual volume of redundant storage devices
US7143249B2 (en) * 2000-10-04 2006-11-28 Network Appliance, Inc. Resynchronization of mirrored storage devices
US6654912B1 (en) * 2000-10-04 2003-11-25 Network Appliance, Inc. Recovery of file system data in file servers mirrored file system volumes
GB2367655A (en) * 2000-10-06 2002-04-10 Nokia Mobile Phones Ltd Method of using an integrated circuit with defects
US6549978B2 (en) 2001-01-17 2003-04-15 International Business Machines Corporation Method for storage controllers with different data formats to access common storage configuration information
US7080135B1 (en) * 2001-01-24 2006-07-18 Advanced Micro Devices, Inc. Systems and methods for accessing an address table of a network device
US7406682B2 (en) * 2001-03-26 2008-07-29 Emc Corporation Translator-compiler for converting legacy management software
US6643735B2 (en) 2001-12-03 2003-11-04 International Business Machines Corporation Integrated RAID system with the capability of selecting between software and hardware RAID
US6985995B2 (en) * 2002-03-29 2006-01-10 Panasas, Inc. Data file migration from a mirrored RAID to a non-mirrored XOR-based RAID without rewriting the data
US7111125B2 (en) * 2002-04-02 2006-09-19 Ip-First, Llc Apparatus and method for renaming a data block within a cache
WO2003102823A1 (en) * 2002-05-31 2003-12-11 Fujitsu It Holdings, Inc. Method and system for intelligent storage management
US7024586B2 (en) * 2002-06-24 2006-04-04 Network Appliance, Inc. Using file system information in raid data reconstruction and migration
US7383379B2 (en) * 2002-08-07 2008-06-03 Hewlett-Packard Development Company, L.P. Manipulating data in a data storage device using an auxiliary memory device
ATE439636T1 (de) * 2002-09-10 2009-08-15 Exagrid Systems Inc Verfahren und vorrichtung zur verwaltung der datenintegrität von sicherungs- und katastrophen- wiederherstellungsdaten
US7130229B2 (en) * 2002-11-08 2006-10-31 Intel Corporation Interleaved mirrored memory systems
US7062673B2 (en) * 2003-05-19 2006-06-13 Hitachi Global Technologies System and method for sparing in RAID-1 system
US20040250028A1 (en) * 2003-06-09 2004-12-09 Daniels Rodger D. Method and apparatus for data version checking
CN101187849A (zh) * 2003-07-07 2008-05-28 日立超大规模集成电路系统株式会社 存储装置和存储系统
US7127505B2 (en) 2003-08-15 2006-10-24 Internet Associates, Llc Methods, computer systems, and computer readable media for generating displays of sets of network addresses with status indicators
US7543296B2 (en) * 2003-08-26 2009-06-02 International Business Machines Corporation Time based multi-tiered management of resource systems
JP2005107838A (ja) * 2003-09-30 2005-04-21 Toshiba Corp ディスクアレイコントローラ及びログ情報記録方法
US7330907B2 (en) * 2003-10-02 2008-02-12 Internet Associates, Llc Methods, computer systems, and computer readable media for controlling the status of network address space
US7386754B2 (en) * 2003-10-16 2008-06-10 Seagate Technology Llc Method and apparatus to improve magnetic disc drive reliability using excess un-utilized capacity
US7290087B2 (en) * 2003-11-26 2007-10-30 International Business Machines Corporation Adaptive grouping in object raid
JP4486348B2 (ja) * 2003-11-26 2010-06-23 株式会社日立製作所 ドライブの稼働時間を抑止するディスクアレイ
US8140860B2 (en) * 2003-12-15 2012-03-20 International Business Machines Corporation Policy-driven file system with integrated RAID functionality
CN100343825C (zh) * 2004-01-05 2007-10-17 华为技术有限公司 一种处理流媒体数据的方法
US7100073B2 (en) * 2004-01-05 2006-08-29 International Business Machines Corporation Grouped-object RAID
CN100419700C (zh) * 2004-02-11 2008-09-17 鸿富锦精密工业(深圳)有限公司 磁盘容错系统及方法
US7194579B2 (en) * 2004-04-26 2007-03-20 Sun Microsystems, Inc. Sparse multi-component files
US7702948B1 (en) * 2004-07-13 2010-04-20 Adaptec, Inc. Auto-configuration of RAID systems
JP4387261B2 (ja) * 2004-07-15 2009-12-16 株式会社日立製作所 計算機システム、および、記憶装置システムの移行方法
US8726129B1 (en) * 2004-07-23 2014-05-13 Hewlett-Packard Development Company, L.P. Methods of writing and recovering erasure coded data
TWI251745B (en) * 2004-07-27 2006-03-21 Via Tech Inc Apparatus and related method for calculating parity of redundant array of inexpensive disks
JP2006113648A (ja) * 2004-10-12 2006-04-27 Hitachi Ltd ディスクアレイ装置
US8131969B2 (en) * 2004-10-20 2012-03-06 Seagate Technology Llc Updating system configuration information
CN100388237C (zh) * 2004-10-20 2008-05-14 北京织女星网格技术有限公司 基于轻量计算的数据重组方法
US8131926B2 (en) * 2004-10-20 2012-03-06 Seagate Technology, Llc Generic storage container for allocating multiple data formats
US7594075B2 (en) 2004-10-20 2009-09-22 Seagate Technology Llc Metadata for a grid based data storage system
US7454686B2 (en) * 2004-11-23 2008-11-18 International Business Machines Corporation Apparatus and method to check data integrity when handling data
CN100409196C (zh) * 2004-12-22 2008-08-06 国际商业机器公司 使用数个存储介质来存储和恢复数据文件的方法
CN100388239C (zh) * 2005-01-18 2008-05-14 英业达股份有限公司 在线增加廉价磁盘冗余阵列磁盘数量的方法与系统
US7516285B1 (en) 2005-07-22 2009-04-07 Network Appliance, Inc. Server side API for fencing cluster hosts via export access rights
JP4394047B2 (ja) * 2005-08-05 2010-01-06 信越ポリマー株式会社 キーフレームおよび押釦スイッチ用カバー部材
CN100414489C (zh) * 2005-09-02 2008-08-27 普安科技股份有限公司 存储虚拟化控制器的同位引擎及同位引擎产生数据的方法
US8010753B2 (en) * 2005-09-28 2011-08-30 International Business Machines Corporation Systems and methods for temporarily transferring use of portions of partitioned memory between host computers
US8291161B2 (en) * 2005-10-07 2012-10-16 Agere Systems Llc Parity rotation in storage-device array
US7769948B2 (en) * 2005-10-07 2010-08-03 Agere Systems Inc. Virtual profiles for storage-device array encoding/decoding
US7644303B2 (en) * 2005-10-07 2010-01-05 Agere Systems Inc. Back-annotation in storage-device array
US7653783B2 (en) * 2005-10-07 2010-01-26 Agere Systems Inc. Ping-pong state machine for storage-device array
US20070130232A1 (en) * 2005-11-22 2007-06-07 Therrien David G Method and apparatus for efficiently storing and managing historical versions and replicas of computer data files
US7653829B2 (en) * 2005-12-08 2010-01-26 Electronics And Telecommunications Research Institute Method of data placement and control in block-divided distributed parity disk array
WO2007121141A2 (en) * 2006-04-11 2007-10-25 Invensys Systems, Inc. Method and supporting configuration user interfaces for streamlining installing replacement field devices
US20070283087A1 (en) * 2006-05-30 2007-12-06 Barry Hannigan Method and structure for adapting a storage virtualization scheme using transformations
US8046629B1 (en) * 2006-07-24 2011-10-25 Marvell World Trade Ltd. File server for redundant array of independent disks (RAID) system
US20080091916A1 (en) * 2006-10-17 2008-04-17 Agere Systems, Inc. Methods for data capacity expansion and data storage systems
WO2008049102A2 (en) * 2006-10-19 2008-04-24 Fair Thomas T System and methods for zero-configuration data backup
KR100854032B1 (ko) * 2007-02-09 2008-08-26 삼성전자주식회사 메모리 시스템 및 그것의 데이터 저장 방법
US8370715B2 (en) * 2007-04-12 2013-02-05 International Business Machines Corporation Error checking addressable blocks in storage
US9396103B2 (en) * 2007-06-08 2016-07-19 Sandisk Technologies Llc Method and system for storage address re-mapping for a memory device
US7861036B2 (en) * 2007-09-18 2010-12-28 Agere Systems Inc. Double degraded array protection in an integrated network attached storage device
JP4402711B2 (ja) * 2007-11-05 2010-01-20 富士通株式会社 ディスクアレイ装置、ディスクアレイ装置制御方法、ディスクアレイ装置制御プログラムおよびディスクアレイ制御装置
US8001417B2 (en) * 2007-12-30 2011-08-16 Agere Systems Inc. Method and apparatus for repairing uncorrectable drive errors in an integrated network attached storage device
US20090271562A1 (en) * 2008-04-25 2009-10-29 Sinclair Alan W Method and system for storage address re-mapping for a multi-bank memory device
JP2010049637A (ja) * 2008-08-25 2010-03-04 Hitachi Ltd 計算機システム、ストレージシステム及び構成管理方法
JP2010066848A (ja) * 2008-09-09 2010-03-25 Toshiba Storage Device Corp 記憶装置の管理方法及び記憶装置、並びに記憶システム
US7904749B2 (en) * 2008-10-24 2011-03-08 Hitachi, Ltd. Fast data recovery from HDD failure
JP5146357B2 (ja) * 2009-02-25 2013-02-20 富士通株式会社 データ診断装置、データ診断システム、データ診断方法及びデータ診断プログラム
US8665601B1 (en) 2009-09-04 2014-03-04 Bitmicro Networks, Inc. Solid state drive with improved enclosure assembly
US8447908B2 (en) 2009-09-07 2013-05-21 Bitmicro Networks, Inc. Multilevel memory bus system for solid-state mass storage
US8560804B2 (en) 2009-09-14 2013-10-15 Bitmicro Networks, Inc. Reducing erase cycles in an electronic storage device that uses at least one erase-limited memory device
US8874628B1 (en) * 2009-10-15 2014-10-28 Symantec Corporation Systems and methods for projecting hierarchical storage management functions
US8473669B2 (en) * 2009-12-07 2013-06-25 Sandisk Technologies Inc. Method and system for concurrent background and foreground operations in a non-volatile memory array
JP4940322B2 (ja) * 2010-03-16 2012-05-30 株式会社東芝 半導体メモリ映像蓄積再生装置及びデータ書込み/読出し方法
US20150121003A1 (en) * 2010-09-07 2015-04-30 Daniel L. Rosenband Storage controllers
US20120059976A1 (en) * 2010-09-07 2012-03-08 Daniel L. Rosenband Storage array controller for solid-state storage devices
US8452911B2 (en) 2010-09-30 2013-05-28 Sandisk Technologies Inc. Synchronized maintenance operations in a multi-bank storage system
US8694866B2 (en) * 2011-03-15 2014-04-08 California Institute Of Technology MDS array codes with optimal building
US9372755B1 (en) 2011-10-05 2016-06-21 Bitmicro Networks, Inc. Adaptive power cycle sequences for data recovery
US8762627B2 (en) 2011-12-21 2014-06-24 Sandisk Technologies Inc. Memory logical defragmentation during garbage collection
US20130198585A1 (en) * 2012-02-01 2013-08-01 Xyratex Technology Limited Method of, and apparatus for, improved data integrity
US8977893B2 (en) * 2012-02-17 2015-03-10 Lsi Corporation Accelerated rebuild and zero time rebuild in raid systems
KR20130097350A (ko) * 2012-02-24 2013-09-03 한국전자통신연구원 비대칭 클러스터링 파일 시스템에서 복제 기반의 파일을 패리티 기반의 파일로 변환하는 장치 및 방법
US9043669B1 (en) 2012-05-18 2015-05-26 Bitmicro Networks, Inc. Distributed ECC engine for storage media
WO2014101144A1 (zh) * 2012-12-28 2014-07-03 华为技术有限公司 储存数据的方法及装置
US9348746B2 (en) 2012-12-31 2016-05-24 Sandisk Technologies Method and system for managing block reclaim operations in a multi-layer memory
US9336133B2 (en) 2012-12-31 2016-05-10 Sandisk Technologies Inc. Method and system for managing program cycles including maintenance programming operations in a multi-layer memory
US9465731B2 (en) 2012-12-31 2016-10-11 Sandisk Technologies Llc Multi-layer non-volatile memory system having multiple partitions in a layer
US9734050B2 (en) 2012-12-31 2017-08-15 Sandisk Technologies Llc Method and system for managing background operations in a multi-layer memory
US9223693B2 (en) 2012-12-31 2015-12-29 Sandisk Technologies Inc. Memory system having an unequal number of memory die on different control channels
US9734911B2 (en) 2012-12-31 2017-08-15 Sandisk Technologies Llc Method and system for asynchronous die operations in a non-volatile memory
US8873284B2 (en) 2012-12-31 2014-10-28 Sandisk Technologies Inc. Method and system for program scheduling in a multi-layer memory
US9423457B2 (en) 2013-03-14 2016-08-23 Bitmicro Networks, Inc. Self-test solution for delay locked loops
US9501436B1 (en) 2013-03-15 2016-11-22 Bitmicro Networks, Inc. Multi-level message passing descriptor
US10489318B1 (en) 2013-03-15 2019-11-26 Bitmicro Networks, Inc. Scatter-gather approach for parallel data transfer in a mass storage system
US9798688B1 (en) 2013-03-15 2017-10-24 Bitmicro Networks, Inc. Bus arbitration with routing and failover mechanism
US9934045B1 (en) 2013-03-15 2018-04-03 Bitmicro Networks, Inc. Embedded system boot from a storage device
US9400617B2 (en) 2013-03-15 2016-07-26 Bitmicro Networks, Inc. Hardware-assisted DMA transfer with dependency table configured to permit-in parallel-data drain from cache without processor intervention when filled or drained
US9734067B1 (en) 2013-03-15 2017-08-15 Bitmicro Networks, Inc. Write buffering
US9720603B1 (en) 2013-03-15 2017-08-01 Bitmicro Networks, Inc. IOC to IOC distributed caching architecture
US9672178B1 (en) 2013-03-15 2017-06-06 Bitmicro Networks, Inc. Bit-mapped DMA transfer with dependency table configured to monitor status so that a processor is not rendered as a bottleneck in a system
US9971524B1 (en) 2013-03-15 2018-05-15 Bitmicro Networks, Inc. Scatter-gather approach for parallel data transfer in a mass storage system
US10120694B2 (en) 2013-03-15 2018-11-06 Bitmicro Networks, Inc. Embedded system boot from a storage device
US9842024B1 (en) 2013-03-15 2017-12-12 Bitmicro Networks, Inc. Flash electronic disk with RAID controller
US9430386B2 (en) 2013-03-15 2016-08-30 Bitmicro Networks, Inc. Multi-leveled cache management in a hybrid storage system
US9916213B1 (en) 2013-03-15 2018-03-13 Bitmicro Networks, Inc. Bus arbitration with routing and failover mechanism
US9875205B1 (en) 2013-03-15 2018-01-23 Bitmicro Networks, Inc. Network of memory systems
US9811455B2 (en) * 2013-03-15 2017-11-07 The Boeing Company Accessing different types of memory by respective distinct command with different timing requirements
US9298398B2 (en) 2013-04-16 2016-03-29 International Business Machines Corporation Fine-grained control of data placement
US9104597B2 (en) 2013-04-16 2015-08-11 International Business Machines Corporation Destaging cache data using a distributed freezer
US9619404B2 (en) 2013-04-16 2017-04-11 International Business Machines Corporation Backup cache with immediate availability
US9329938B2 (en) 2013-04-16 2016-05-03 International Business Machines Corporation Essential metadata replication
US9298617B2 (en) 2013-04-16 2016-03-29 International Business Machines Corporation Parallel destaging with replicated cache pinning
US9423981B2 (en) 2013-04-16 2016-08-23 International Business Machines Corporation Logical region allocation with immediate availability
US9104332B2 (en) 2013-04-16 2015-08-11 International Business Machines Corporation Managing metadata and data for a logical volume in a distributed and declustered system
KR20140124674A (ko) * 2013-04-17 2014-10-27 한국전자통신연구원 파일 수준의 데이터 분산 저장 방법
US9952991B1 (en) 2014-04-17 2018-04-24 Bitmicro Networks, Inc. Systematic method on queuing of descriptors for multiple flash intelligent DMA engine operation
US10055150B1 (en) 2014-04-17 2018-08-21 Bitmicro Networks, Inc. Writing volatile scattered memory metadata to flash device
US10042792B1 (en) 2014-04-17 2018-08-07 Bitmicro Networks, Inc. Method for transferring and receiving frames across PCI express bus for SSD device
US10078604B1 (en) 2014-04-17 2018-09-18 Bitmicro Networks, Inc. Interrupt coalescing
US9811461B1 (en) 2014-04-17 2017-11-07 Bitmicro Networks, Inc. Data storage system
US10025736B1 (en) 2014-04-17 2018-07-17 Bitmicro Networks, Inc. Exchange message protocol message transmission between two devices
US9588843B2 (en) * 2014-07-14 2017-03-07 International Business Machines Corporation System and method for transferring traditional RAID to distributed array
CN104714758B (zh) * 2015-01-19 2017-07-07 华中科技大学 一种基于校验raid加入镜像结构的阵列构建方法及读写系统
US10042553B2 (en) 2015-10-30 2018-08-07 Sandisk Technologies Llc Method and system for programming a multi-layer non-volatile memory having a single fold data path
US10133490B2 (en) 2015-10-30 2018-11-20 Sandisk Technologies Llc System and method for managing extended maintenance scheduling in a non-volatile memory
US9778855B2 (en) 2015-10-30 2017-10-03 Sandisk Technologies Llc System and method for precision interleaving of data writes in a non-volatile memory
US10120613B2 (en) 2015-10-30 2018-11-06 Sandisk Technologies Llc System and method for rescheduling host and maintenance operations in a non-volatile memory
US10606501B2 (en) * 2015-12-04 2020-03-31 International Business Machines Corporation Management of paging in compressed storage
KR102533389B1 (ko) 2016-02-24 2023-05-17 삼성전자주식회사 장치 수명을 향상시키는 데이터 저장 장치 및 이를 포함하는 raid 시스템
CN105843556B (zh) * 2016-03-21 2019-01-11 浙江宇视科技有限公司 一种vd选取方法及装置
CN107870730B (zh) * 2016-09-23 2020-11-20 伊姆西Ip控股有限责任公司 用于管理存储系统的方法和系统
US10552050B1 (en) 2017-04-07 2020-02-04 Bitmicro Llc Multi-dimensional computer storage system
CN109725838B (zh) * 2017-10-27 2022-02-25 伊姆西Ip控股有限责任公司 用于管理多个盘的方法、装置以及计算机可读介质
CN108170117B (zh) * 2017-11-24 2020-12-15 宁波兴为汽车电子有限公司 一种车载模块参数自动识别分配的方法及系统
US11169961B2 (en) * 2018-06-29 2021-11-09 Weka.IO Ltd. Data migration in a distributive file system
CN111124746B (zh) * 2018-10-30 2023-08-11 伊姆西Ip控股有限责任公司 管理独立盘冗余阵列的方法、设备和计算机可读介质
CN111124269B (zh) 2018-10-31 2023-10-27 伊姆西Ip控股有限责任公司 用于存储管理的方法、电子设备和计算机可读存储介质
CN111324287A (zh) * 2018-12-14 2020-06-23 北京兆易创新科技股份有限公司 一种存储器
US10977073B2 (en) * 2019-07-10 2021-04-13 Dell Products L.P. Architectural data mover for RAID XOR acceleration in a virtualized storage appliance

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5148432A (en) * 1988-11-14 1992-09-15 Array Technology Corporation Arrayed disk drive system and method
US5166939A (en) * 1990-03-02 1992-11-24 Micro Technology, Inc. Data storage apparatus and method
JPH0731582B2 (ja) * 1990-06-21 1995-04-10 インターナショナル・ビジネス・マシーンズ・コーポレイション パリティ保護データを回復するための方法および装置
US5210866A (en) * 1990-09-12 1993-05-11 Storage Technology Corporation Incremental disk backup system for a dynamically mapped data storage subsystem
US5375128A (en) * 1990-10-18 1994-12-20 Ibm Corporation (International Business Machines Corporation) Fast updating of DASD arrays using selective shadow writing of parity and data blocks, tracks, or cylinders
US5345565A (en) * 1991-03-13 1994-09-06 Ncr Corporation Multiple configuration data path architecture for a disk array controller
US5301297A (en) * 1991-07-03 1994-04-05 Ibm Corp. (International Business Machines Corp.) Method and means for managing RAID 5 DASD arrays having RAID DASD arrays as logical devices thereof
US5410667A (en) * 1992-04-17 1995-04-25 Storage Technology Corporation Data record copy system for a disk drive array data storage subsystem
US5708668A (en) * 1992-05-06 1998-01-13 International Business Machines Corporation Method and apparatus for operating an array of storage devices
US5581724A (en) * 1992-10-19 1996-12-03 Storage Technology Corporation Dynamically mapped data storage subsystem having multiple open destage cylinders and method of managing that subsystem
US5487160A (en) * 1992-12-04 1996-01-23 At&T Global Information Solutions Company Concurrent image backup for disk storage system
JPH06187249A (ja) * 1992-12-16 1994-07-08 Nec Eng Ltd ディスクアレイ装置
US5463765A (en) * 1993-03-18 1995-10-31 Hitachi, Ltd. Disk array system, data writing method thereof, and fault recovering method
US5581690A (en) * 1993-06-29 1996-12-03 Digital Equipment Corporation Method and apparatus for preventing the use of corrupt data in a multiple disk raid organized storage system
US5390327A (en) * 1993-06-29 1995-02-14 Digital Equipment Corporation Method for on-line reorganization of the data on a RAID-4 or RAID-5 array in the absence of one disk and the on-line restoration of a replacement disk
US5504858A (en) * 1993-06-29 1996-04-02 Digital Equipment Corporation Method and apparatus for preserving data integrity in a multiple disk raid organized storage system
US5392244A (en) * 1993-08-19 1995-02-21 Hewlett-Packard Company Memory systems with data storage redundancy management
US5446855A (en) * 1994-02-07 1995-08-29 Buslogic, Inc. System and method for disk array data transfer
US5479653A (en) * 1994-07-14 1995-12-26 Dellusa, L.P. Disk array apparatus and method which supports compound raid configurations and spareless hot sparing
US5412668A (en) * 1994-09-22 1995-05-02 International Business Machines Corporation Parity striping feature for optical disks
US5463776A (en) * 1994-09-22 1995-10-31 Hewlett-Packard Company Storage management system for concurrent generation and fair allocation of disk space among competing requests
US5615352A (en) * 1994-10-05 1997-03-25 Hewlett-Packard Company Methods for adding storage disks to a hierarchic disk array while maintaining data availability
US5666512A (en) * 1995-02-10 1997-09-09 Hewlett-Packard Company Disk array having hot spare resources and methods for using hot spare resources to store user data
US5537534A (en) * 1995-02-10 1996-07-16 Hewlett-Packard Company Disk array having redundant storage and methods for incrementally generating redundancy as data is written to the disk array

Also Published As

Publication number Publication date
CN1247608A (zh) 2000-03-15
JP2000511318A (ja) 2000-08-29
TW436689B (en) 2001-05-28
KR20000070207A (ko) 2000-11-25
US5960169A (en) 1999-09-28
WO1998038568A1 (en) 1998-09-03
JP3266277B2 (ja) 2002-03-18
KR100321843B1 (ko) 2002-02-02

Similar Documents

Publication Publication Date Title
CN1191518C (zh) 用于分级存储管理系统的转换廉价磁盘冗余阵列
US6006308A (en) Removable library media system utilizing redundant data storage and error detection and correction
US7191286B2 (en) Data redundancy in individual hard drives
US7281160B2 (en) Rapid regeneration of failed disk sector in a distributed database system
US7206991B2 (en) Method, apparatus and program for migrating between striped storage and parity striped storage
US7523356B2 (en) Storage controller and a system for recording diagnostic information
US20150371684A1 (en) Ultra high capacity ssd
US7721143B2 (en) Method for reducing rebuild time on a RAID device
JP3682256B2 (ja) ディスクアレイ装置及び同装置におけるパリティ処理方法
CN101916173B (zh) 一种基于raid的数据读写方法及其系统
US20060156059A1 (en) Method and apparatus for reconstructing data in object-based storage arrays
US20070083709A1 (en) Method and system for storing data in an array of storage devices with additional and autonomic protection
US20080184062A1 (en) System and method for detecting write errors in a storage device
CN1776675A (zh) 用于存储并使用多存储位置中的元数据的方法和系统
US20060236149A1 (en) System and method for rebuilding a storage disk
WO1993023803A1 (fr) Appareil de commande pour pile de disques
CN1512353A (zh) 性能改善的数据存储和方法
CN1808611A (zh) 检测不准确数据的设备和方法
US20060077726A1 (en) Data transfer method, storage apparatus and computer-readable storage medium
JP4884721B2 (ja) 記憶装置のフォーマットを不要としたストレージシステム及び記憶制御方法
US6363457B1 (en) Method and system for non-disruptive addition and deletion of logical devices
US7386754B2 (en) Method and apparatus to improve magnetic disc drive reliability using excess un-utilized capacity
US20040128582A1 (en) Method and apparatus for dynamic bad disk sector recovery
US7293193B2 (en) Array controller for disk array, and method for rebuilding disk array
US10831601B2 (en) Reconstruction hard disk array and reconstruction method for to-be-reconstructed hard disks therein including comparing backup data with an access timestamp of first, second and third hard disks

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term

Granted publication date: 20050302

CX01 Expiry of patent term