爱玩科技网
您的当前位置:首页网络存储技术的应用

网络存储技术的应用

来源:爱玩科技网


数据存储论文

题目名称: 网络存储技术的应用 学院名称: 计算机科学与信息工程学院 专业班级: 学生姓名:

2011年1月

目 录

一、成员分工 ............................................................................................ 1 二、摘要 .................................................................................................... 1 三、正文 .................................................................................................... 2 3.1 网络存储技术的分类 ........................................................................ 2 3.2 NAS、SAN和DAS的比较 ................................................................. 3 3.3 NAS和SAN的比较 ........................................................................... 4 3.4 网络存储系统的特性要求 .............................................................. 5 3.5 存储区域网络设计 .......................................................................... 6 3.5.1 存储系统设计原则 .................................................................... 6 3.5.2 存储系统架构概述 .................................................................... 7 四、总结 .................................................................................................... 8 五、参考文献 ............................................................................................ 9

一、成员分工

搜集资料 文字输入:XX 文字排版 更正错误: XX

二、摘要

随着信息化的迅速发展,越来越多的信息被数据化,网络数据信息爆炸性的增长,使网络存储技术变得越来越重要。采用何种方式完成数据的网络存储,如何提高网络存储的安全性,稳定性,如何提高网络存储的效率是现在网络存储最关心的问题。就常见的3种网络存储技术的优缺点及应用范围进行了介绍和讨论。

关键词:网络存储;直接连接存储(DAS);网络附加存储(NAS);存储区域网络(SAN)

1

三、正文

在传统企业IT系统中,主机系统既负责数据的计算,也在通过文件系统、数据库系统等手段对数据进行逻辑和物理层面的管理。然而,由于历史发展的原因,主流操作系统(Windows/Linux/Free BSD/SCO UNIX/AIX/Solaris/HP-UX/IRIX等)多达近10种,文件系统格式(FAT/NTFS/EXT2/EXT3/J FS/UFS/VxFS/HFS等)也同样令人眼花缭乱。各种标准和各种版本拥挤在用户的系统环境中,使数据被分割成杂乱分散的“数据孤岛”(data island),无法在系统间自由流动,自然也就谈不上设备的充分利用和资源共享。

信息是一个企业可持续发展的核心动力之一,信息的可靠存储是一个企业得以正常运作和发展壮大的根本所在。随着越来越多的关键信息转化为数字形式并存储在可管理的介质中,用户对存储和管理信息的能力产生了新的需求。为更有效地使用和管理信息,用户对信息系统的搭建、数据中心的建设、数据的管理模式、数据的有效使用、信息存储介质的选择以及信息的安全存储等方面,提出多样化的要求,以达到数据的最佳利用。

网络存储设备提供网络信息系统的信息存取和共享服务,其主要特征体现在:超大存储容量、大数据传输率以及高可用性。要实现存储设备的性能特征,采用RAID作为存储实体是必然选择。传统的网络存储设备都是将RAID硬盘阵列直接连接到网络系统的服务器上,这种形式的网络存储结构称为(DAS Direct Attached Storage),目前,按照信息存储系统的构成,SAN(Storage Area Net-work)和NAS(Network Attached Storage)是最常见的2种选择。以网络存储中的主流技术——SAN(存储区域网)为例,讨论一个SAN存储架构技术范例,以及如何在存储区域网中部署存储设备,制定更加合理的数据存储备份机制,以构造出高可用性的存储区域网络系统。

3.1 网络存储技术的分类

早期的存储系统是计算机系统的一部分,大多以存储设备形式出现。计算机系统可以通过总线连接到磁盘,或者通过输入输出系统和磁盘系统相连,或者是

2

计算机基本。网络存储技上是以单机方式工作的。随着网络的发展,数据的存储也逐渐由单机向多机方式和专用机发展,数据的共享和传递也逐渐从依靠主机系统向依靠网络系统发展。当前,应用业务系统有向多服务器、多数据源演变的趋向。在大型企业应用和Internet发布系统中,安装数十台服务器已经很常见。但过于分散的数据资源,会给访问和管理带来困难。因此,数据存储新问题备受关注。存储系统大致可以分成3种类型:

(1) 直接依附存储系统(Direct Attached Storage,DAS)。直接依附存储系统DAS又称为以服务器为中心的存储体系。其特征为存储设备是通用服务器的一部分,该服务器同时提供给应用程序的运行,例如视频流、数据库等服务。数据的输入/输出由服务器负责,数据访问和操作系统、文件系统和服务程序紧密相关。

(2) 网络依附存储系统(Network Attached-storage,NAS)。这种存储方式多采用专用数据服务器。该服务器不再承担应用服务, 称之为瘦服务器(Thin Server)。数据服务器通过局域网的接口和应用服务器连接。由于采用局域网上通用数据传输协议,如NFS,CIFS等,所以能够在异构的服务器间共享数据, 这一点在Windows和UNIX混合环境下是十分重要的。

(3) 存储区域网络(Storage Area Network,SAN)。存储区域网络SAN采用高速数据连接光纤通道(Fiber Channel, FC)连接服务器和存储系统。从结构上看,服务器和数据存储系统相互。将设备连接到FC集线器或交换机上,便于扩展系统规模。FC的传输速率和可靠性极高,能够满足当前音/视频业务的需求。在SAN中,所有的存储设备和存储数据均可采用中心化管理,使得整个存储系统具有可伸缩性。

3.2 NAS、SAN和DAS的比较

(1)性。存储系统的性反映了服务器和存储系统间的依靠程度。性越强,服务器和存储系统之间的相关性就越小。实际上,性强的存储系统可以自成体系,不必考虑和服务器物理连接的细节。

(2)带宽和瓶颈。在传统存储系统中,应用程序必须通过服务器访问存储

3

设备。考虑到所有的访问都必须穿透服务器,轻易形成瓶颈,因此要求服务器有很大的吞吐速率。LAN的速率和服务质量(QoS)取决于网络类型。

(3)共享性。在传统存储服务器体系中,存储设备并非直接面向网络用户或应用程序,而是以服务器作为访问的人口。作为存储设备,无论是硬盘、还是阵列,都是间接地提供数据共享服务,真正意义上的物理连接只有服务器的连接。NAS具有数据存储性,可以通过LAN上运行的NFS、CIFS协议实现数据共享。SAN直接支持服务器和存储系统之间的多对多连接,具有共享特性。

(4)可扩展性。DAS体系只能通过增加服务器和磁盘存储量来扩展容量,单一扩展容量几乎不可行;业务增长造成的访问流量增加会使服务器成为瓶颈,而扩展服务器价格过高且管理难度加大。NAS可以通过扩展I/0节点而增加容量,其带宽可以通过新增的网络接口而得以提高。SAN具有可扩展性,可增加存储设备而实现系统扩充。

(5)可管理性。传统的DAS造成企业中有大量的服务器和存储系统,其异构型和分布性使管理工作难以展开。NAS、SAN均采用中心化数据管理,便于控制网络上的每一个存储点。

(6)存储介质的多样性。虽然DAS可以采用多种存储介质,但是它和服务器之间紧密的物理连接,在使用上受到较多。基于SAN的存储系统内,存储设备和文件服务器被有效地分离,使得整个系统可以采用多种存储介质;并且利用不同存储介质和设备的特征,通过统一的中心数据管理,建立多层次的异构存储体系。

3.3 NAS和SAN的比较

NAS、SAN和DAS相比而言,无论是从网络传输带宽、数据共享性还是从存储容量的可扩充性、数据的一体化和平安性等各方面来说,其优越性是不言而喻的。所以,现在众多的用户在对其存储方案进行选择时,实际上也就成为对NAS和SAN的选择了。

NAS和SAN有许多共同的特征。它们都提供集中化的数据存储和整合优化,都能有效地存取文件,都能在众多的主机间共享并支持多种操作系统,都能从应

4

用服务器上分离存储。而且,它们都提供数据的高可用性,都能通过冗余部件和RAID保证数据的完整性。

NAS和SAN也有着一些不同点。首先,实施和维护的难易程度解不同。上面曾提到,NAS的存储设备和众多访问客户的连接是通过标准的LAN进行的,也就是说,直接将NAS存储设备接入LAN中就可以使用了,管理者所要做的只是来定义网络存取权限或为每个用户定义磁盘限额。而且由于NAS采用了热插拔和即插即用技术,所以在新设备接人时无需关闭数据服务器或进行重新配置,新增的存储空间可以立即为众多的应用服务器和客户机所共享。而SAN的存储设备和客户之间的联系是通过专用FC集线器和交换机来进行的,假如客户端增加,就要对交换机进行级连,这就大大增大了安装和设置难度。其次,二者的设备管理难易程度不同。由于NAS中每一个I/O节点都有自己的存储设备,而这些设备又没有一个统一的管理的界面,所以管理人员就必须逐一管理每个NAS设备,从而使管理成本随网络上的NAS设备的增多而线性增加。而SAN对整个网络中的存储设备的管理,是采用SAN专用管理软件来进行集中式管理的,用户可以通过简单的图形界面来管理不同平台和介质上的数据,也就是说,在SAN中,其整个存储网络成为了一个集中化的存储池,这样,管理人员管理起来就非常简单了。再者,NAS和SAN是管理对象也不相同。SAN管理的是磁盘空间,而NAS管理的是文件,也就是说,SAN是个磁盘工厂,而NAS只是一个文件服务器。最后,也是最重要的一点,那就是二者在性能上有所不同。NAS是基于传统以太网络的存取设备,虽然减轻了服务器所承担的压力,但势必严重增加网络的负荷。

3.4 网络存储系统的特性要求

要达到存储系立的数据管理目标,对存储系统的特性有如下几个方面的要求,按照重要性排列分别是:

(1)可靠性。数据集中到存储系统中,必然对系统设备的可靠性提出更高的要求。同时需要建立数据备份、容灾系统进行配合,提高数据安全性。

(2)可扩展性。网络时代业务发展的不确定性和数据的高速膨胀,对

5

于计算系统之外的存储系统,必然提出高可扩展性的要求。这种扩展性并非是简单的容量扩展,同时还必须包括数据处理能力、数据交换带宽和数据管理功能的扩展。

(3)兼容性。虽然存储系统已分离于计算系统之外,但今天主机系统对数据的使用方式,仍旧以文件系统、数据库系统为主要手段。存储系统要适应各种主机系统的数据I/O要求,就必须能够兼容各种操作系统、文件系统、数据库系统等各种传统数据管理手段。

(4)可管理性。支持各种主流的管理协议和管理架构,能够与网络、计算机等各种设备统一管理和集中管理,能够在各种复杂的环境中实现方便统一的设备和数据管理功能。

(5)性能。能够根据不同应用类型要求,提供带宽、IOPS(IO Per Second,每秒IO操作数) 、OPS( Operations Per Second, 每秒并发操作数)、ORT(Overall Response Time,总响应时间)等不同指标侧重点的性能服务。高端系统还应能够对系统性能进行动态的扩展和调整。

(6)功能。各种数据迁移、数据分发、数据版本管理、数据复制、在线扩容等数据管理功能。

3.5 存储区域网络设计

3.5.1 存储系统设计原则

为了确保存储的现场采集数据和运营数据万无一失,设计方案满足以下几个要求:

(1)采用基于SAN的存储网络,保证数据高安全性、高可靠性、高可用性等3个基本要求。支持在任何需要的时候增加存储网络中的相关设备(服务器设备,存储设备等)能力,适应未来的网络结构拓展和容量增加。

(2)考虑到由于设备、网络结构单点故障给未来系统运行带来的不可预知的影响,在整体网络设计中硬件设备选型和数据链路设计中全部采用冗余结构:设备选型在关键部件采取冗余结构,部件可以全部做到在线更换设计;数据通路

6

利用软件功能配合硬件的双链路设计,有效消除数据通路的故障隐患。

(3)存储系统管理对每台主机的双链路做出统一管理,自动侦测每条链路的完好性,一旦一条数据链路出现故障在没有用户干预的情况下自动切换到健康的数据链路,保证数据访问的实时性;另外,还具备数据流量的负载均衡能力,在每台主机可用的数据链路中根据不同的策略,如应用程序的优先级别,每条链路的队列长度等等,优化数据通路中传输的数据,从而充分利用双数据链路连接的优势。

3.5.2 存储系统架构概述

存储系统采用存储区域网(SAN)架构,其中硬件设备包括高端小型机、高性能PC服务器、企业级SAN交换机、企业级存储阵列、虚拟带库、磁带库、负载均衡交换机。小型机部分通过划分硬件分区,定制和分配硬件资源来组成数据服务器集群,并在应用环境中进行有效的负载均衡。多个业务应用系统部署在不同的硬件小型机和PC服务器上,每个业务均有应用负载均衡配置,系统访问认证、身份认证服务器通过F5 4层交换机进行负载均衡。高端存储阵列通过快速的、专用的SAN网络交换机连接,并通过链路冗余提高可靠性,存储阵列根据不同应用系统数据量的需求进行存储空间划分,存储阵列硬件配置有主机柜和扩展柜,存储阵列之间使用LVM Mirror(卷管理器)的数据镜像方式来实现本地冗余数据备份,并配置硬件虚拟磁带库来提高数据备份性能,最终数据可通过磁带库使用磁带备份介质进行异地保存。

7

四、总结

数据的重要性越来越得到人们的广泛认同。未来网络的核心将是数据,网络化存储正是数据存储的一个发展方向。通过对现有网络存储的比较,显而易见,在未来的网络应用中,SAN将成为网络存储的主流。首先,SAN结构简单,易于实现,其次,初期投资较少,除了NAS文件服务器本身,存储系统几乎不需购买其他任何设备;最后,SAN易于实现多个局域网子网段的存储共享。

8

五、参考文献

[1]. 王改性,师鸣若 数据存储备份与灾难恢复. 电子工业出版社.2009年06月 [2]. 鲁士文. 存储网络技术及应用. 清华大学出版社.2010年02月

[3]. 张冬. 大话存储-网络存储系统原理精解与最佳实践.清华大学出版社. 2008

9

因篇幅问题不能全部显示,请点此查看更多更全内容