您的位置:首页 > 其它

集群存储系统基础知识

2012-03-19 13:23 337 查看
集群存储系统已经在存储服务器中运行了有段时间了。很多时候都是应用在重要的数据存储上。能够保证数据的存储持续性,以及服务的可持续性。那么到底什么是集群存储系统呢?他又是如何工作的呢。下文会给你一些实质上的帮助。

两台控制器耦合在一起,互为冗余,如果其中一台设备发生了故障,另一台将会自动顶替上,维持业务的连续性,这就是最简单的集群存储系统形式。凡是支持active-passive工作模式的冗余双控制器配置方案,两台控制器中总有一台一直处于备用状态,从控制器并不会分担主控制器的工作负载,而且系统容量是无法扩展的,所以,active-passive方案又被称作“伪集群”。而支持active-active工作模式的冗余控制器配置方案,则是在仿集群存储系统的基础之上向前迈进了一步,在两台控制器之间实现了双向的失效切换和负载均衡分配。

在非分布式的active-active集群系统中,集群成员共享一个文件系统及其它的物理设备资源,它最大的缺点就是:给指定控制器分配存储资源及逻辑单元号(LUN)的工作,主要由存储管理员来完成。分布式集群存储系统是目前大多数存储厂商最喜欢采用的架构,在设计和搭建系统方案时不需要受任何条条框框的限制。在分布式集群存储系统中,所有的物理存储资源都被整合到一个虚拟的存储池内,管理员们只需要留意一下存储设备与服务器的连接方式,以及它所运行的应用程序类型就可以了,诸如配置存储资源之类的琐碎事情都由系统自动处理,不需要管理员插手。

目前市面上有几款适合于集群存储系统的全局文件系统工具,IBM公司推出的SAN文件系统(SAN FS)就是其中的佼佼者。这类程序一般运行于某台存储设备或带有客户端程序的智能交换机上,在其支持的主机服务器上运行,共同构成集群存储系统的核心组件——全局文件系统。

SAN FS及其同类产品采用的是双交叉(two-pronged)的处理方式:以IP网络连结多点的服务器,让分布式的储存网络能够像单一的服务器本地文件系统一样运作,不管数据所依附的是那一套操作系统,该软件都会持续追踪描述性的信息(descriptive information)──也就是所谓的元数据(metadata,即:文件内伴随实际内容而有的一些信息,如实体位置、文件大小、访问权限,等等)。这样一来,就可以依照即定的策略,实现相连的各存储设备间的数据迁移,从而提高了系统整体的资源管理水平和分层存储的效率,有助于推动信息生命周期管理的实施进程。SAN FS可与运行Windows、Linux、Unix等主流操作系统的服务器协同作业,不过,必须使用IBM的存储系统来存放元数据;它可以支持各种后端存储系统,如果与IBM的SAN卷管理器(SVC)搭配使用的话,就可以与其它厂商的磁盘阵列互通。

除了IBM的SAN FC之外,目前市面上发售的集群存储系统软件还有Ibrix Inc.的Fusion、PolyServe Inc.的Matrix Cluster、Red Hat Inc.的Global File System (其前身为Sistina GFS)、 SGI的InfiniteStorage Shared Filesystem CXFS和Veritas Software Corp.的Cluster Server。它们都是基于主机的应用软件,可将SAN网络中分布的服务器集群存储系统在一起,提供一个统一的管理界面。

集群文件系统(即:软件集群产品)之所以受到用户的追捧,主要是因为它们能够支持多厂商的存储设备,让用户以往的投资不至于被浪费。相比之下,如果采用硬件集群存储系统的话,就需要添置新的硬件设备,费用比较大。

当然,并不是说所有的集群存储系统都需要采用虚拟化技术或全局文件系统。Evaluator Group公司的资深合伙人兼首席分析师Randy Kerns是这样点评SAN FS的:“它是一套类似于存储虚拟化的元数据服务器。”SAN FS虽然是集群存储系统中的关键组件,却并不是集群存储系统的全部。“它是实现全局命名空间的一种途径,”Kerns强调说,“不过,谁也没有规定,全局命名空间一定要跟集群存储系统挂上钩。”

转载来自:http://tech.watchstor.com/storage-systems-119876.htm
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息