您的位置:首页 > 大数据 > 人工智能

【RAID】基本结构

2016-04-14 09:00 429 查看
RAID基本结构
【原创】版权所有。

【IDE硬盘接口】

IDE的英文全称为“Integrated Drive Electronics”,即“电子集成驱动器”,它的本意是指把“硬盘控制器”与“盘体”集成在一起的硬盘驱动器。把盘体与控制器集成在一起的做法减少了硬盘接口的电缆数目与长度,数据传输的可靠性得到了增强,硬盘制造起来变得更容易,因此硬盘生产厂商不需要再担心自己的硬盘是否与其它厂商生产的控制器兼容。

下图就是IDE接口的硬盘。



IDE接口硬盘一般就是我们俗称的并行规格的PATA硬盘,属于Ultra-ATA的并行总线接口硬盘产品。

因为目前主流的PATA硬盘仅能支持ATA/100和ATA/133两种数据传输规范,传输速率最高只能达到 每秒100或133MB,这仅可以满足目前一般情况下的大容量硬盘数据传输。

注意:IDE接口总线是并行

【STAT接口硬盘】

SATA的全称是Serial Advanced TechnologyAttachment(串行高级技术附件,一种基于行业标准的串行硬件驱动器接口)

SATA规范将硬盘的外部传输速率理论值提高到了150MB/s,比PATA标准ATA/100高出50%,比ATA/133也要高出约13%,而随着未来后续版本的发展,SATA接口的速率还可扩展到2X和4X(300MB/s和600MB/s)。



注意:SATA接口总线是串行

那么下列各种接口的设备读写文件的速度理论值为:

IDE:133Mbps

SATA1:300Mbps

SATA2:600Mbps

SATA3:6Gbps

USB3.0:480Mbps

SCSI:(Small Computer System Interface)小型计算机,这种接口的硬盘一般来说里面都有个小型cpu用来帮助数据的存储和管理,这种硬盘 的转速都很快,一般都在10000转/分钟以上。

下图就是SCSI接口的硬盘



对于服务器来说这些硬盘的读写速度都太慢,比如一个文件服务器,可能有3000个用户同时过来访问同一数据,每个用户都来下载文件,并且都是并行下载。那么用一个硬盘来提供下载速度是一定很慢的,因为一个硬盘的存储,读写速度是固定的。为了解决这一困难,我们就要寻找一种能够有着更大I/O能力(即读写速度更高)的设备。

一个设备的读写速度是固定的,如果我们能够将多个设备组和起来并行工作,那么读写速度就可以提高。

【RAID】(RedundantArrays of Independent Disks,RAID)独立磁盘构成的具有冗余能力的阵列。是把相同的数据存储在多个硬盘的不同的地方,以此来提高文件存储和访问速度的一种方法。

冗余:荣错能力

RAID是有级别的,但级别仅代表磁盘的组合方式。

【RAID0】的存储方法为:(条带)

比如现在要存储一个100G的数据,那么为了提高文件的存储速度,就用4个盘来存储,那么就将这100G的数据被调带化切割成4份,分别存储在4块硬盘中,那么在不能提高硬盘的存储速度的情况下这样就可以提高对单个文件到的存储速度。那么像这种将多个磁盘组合起来当做一个磁盘来使用去存储的机制就叫RAID,向下图这种存储的方法叫做RAID0,实际上在这种存储方法中每个数据都在每个磁盘的对应位置都是相同的,即统一条中。这种存储方法也称为条带。如下图:



在我们存储数据中,不仅仅要考虑到数据的存储速度,也同时要考虑数据出错的概率,那么像上面的RAID存储方法中虽然提高了数据的存储速度但,但同时提高了数据的出错率。如果在这种存储方式中,如果其中一个磁盘块了,其他磁盘的数据也就没有意义了。

【RAID1】存储方式,也称为磁盘镜像

RAID1的存储方式,就行将一个磁盘同时存储在两个硬盘中,这种方式没有提高数据的存储速度但提降低了数据的出错率,即:如果其中任何一个磁盘坏了,该数据还是可以修复回来。这种方式也就是使用镜像方式来保存数据的可用性



【RAID4】存储方式:校验码技术

假如要存储一个2G的数据,那么就将这些数据平均分配到4-1=3快盘中。剩下的一块盘就放这3份数据的校验码。即将这个2G的数据分别分为1,2,3。那么前三块磁盘分别存放1,2,3。最后一块磁盘存放这个数据的校验码6。这样如果其中任何一块磁盘坏掉更具其他3块磁盘的数据可以重新计算出剩下一块磁盘的数据。那么在这个存储方式中浪费比例为1/n,并且这样的存储方式不能同时两块磁盘出错,如果同时出错,那么这个其他盘中存储的数据就无意义了。同时在这种存储方式中校验码磁盘的访问次数要多余其他磁盘的访问次数。校验码盘的压力也非常大



向这样的RAID4的存储方式中,如果一个磁盘数据出错后,你替换一个磁盘重新修复数据,如果修复过程中数据又出错了。那么这些数据一样是无效的。并且在这样的数据修复过程中出错的概率相当大。所以这种存储方式看是非常不错,但很少有企业使用。

【RAID5】轮换校验码技术

RAID5的存储方式中只是相对于RAID4来说并没有吧校验码全部存放在一个磁盘中,而是分别存放在不同磁盘中。这样就可以平均的分配磁盘的访问次数。



【RAID6】

RAID6也是在RAID5的基础上使用校验码技术,但比RAID5要多一块磁盘,多的那块磁盘也是存储校验码。这样两组校验码也是使用轮替的方式存储。但这两组校验码的校验方式不同。那么在这个系统中RAID6的比RAID5就多了一种优势,就是能同时坏掉两块盘,

【RAID1+0】存储方式即:1+0先利用镜像再利用条带。

在这种方式中,先将数据切割成3份,然后分别存储在两块区域的磁盘中,其中一块区域的磁盘作为另一块区域磁盘的镜像。



事实上,在这个存储方式中第一区域的数据条带的方式未必和第二个区域的吊带方式一样,所以这样的存储方式中,假如其中某一个磁盘损坏,那么为了修复该数据这整个全局的数据都要参与计算。所以这样的方式缺点,一个盘损坏影响全局。

【RAID0+1】存储方式即0+1存储方式。

这种方式先做条带,后坐镜像。这种方式即使其中一个磁盘损坏,只要用该组中相同编号的磁盘进行修复就行了,这样的方法即使一个磁盘损坏,也不会影响整个存储系统去修复。



所以在RAID0+1的存储方式是要好于RAID1+0的存储方式的。

【Jbod】存储方式。

Jbod的效果就是将多个小磁盘叠加成一个大磁盘。对于应用程序开来,就像在一个磁盘中存储文件一样。Jbod的方式没有提高磁盘的存储速率,但真加了单个文件的最大大小。即:能存放的单个文件可以很大



那么在按照上面的结束对于不同的结构可以得到以下结论

0:条带

性能表现:读,写提升

冗余能力(荣错能力):无

空间利用率:100%

至少2块盘

1:镜像

性能表现:写性能下降,读性能提升

冗余能力:有

空间利用率:1/2

至少2块盘

2

3

4

5:轮替校验码

性能表现:读,写提升

冗余能力:有

空间利用率:(n-1)/n

至少需要3块盘

1+0:

性能表现:读写提升

冗余能力:有

空间利用率:1/2

至少需要4块

0+1:

性能表现:读,写提升

冗余能力:有

空间利用率:1/2

至少需要4块

5+0:

性能表现:无提升

冗余能力:有

空间利用率:(n-2)/n

至少需要6块

jbod:

性能表现:无提升

冗余;能力:无

空间利用率:100%

至少2块盘

在上面这些结构中一般有钱的企业都使用RAID0+1方式存储。向RAID5+0以及jbod方式的存储方式还是很多的。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: