网络附加存储
简介网络附加存储即NAS是(Network Attached Storage )的简称,中文称为网络附加存储。在NAS存储结构中,存储系统不再通过I/O总线附属于某个特定的服务器或客户机,而是直接通过网络接口与网络直接相连,由用户通过网络访问。
NAS网络附属存储介绍NAS网络附属存储是一种将分布、独立的数据整合为大型、集中化管理的数据中心,以便于对不同主机和应用服务器进行访问的技术。
NAS被定义为一种特殊的专用数据存储服务器,包括存储器件(例如磁盘阵列、CD/DVD驱动器、磁带驱动器或可移动的存储介质)和内嵌系统软件,可提供跨平台文件共享功能。NAS通常在一个LAN上占有自己的节点,无需应用服务器的干预,允许用户在网络上存取数据,在这种配置中,NAS集中管理和处理网络上的所有数据,将负载从应用或企业服务器上卸载下来,有效降低总拥有成本,保护用户投资。
NAS本身能够支持多种协议(如NFS、CIFS、FTP、HTTP等),而且能够支持各种操作系统。通过任何一台工作站,采用IE或Netscape浏览器就可以对NAS设备进行直观方便的管理。
NAS实际上是一个带有瘦服务器(Thin Server)的存储设备,其作用类似于一个专用的文件服务器。这种专用存储服务器不同于传统的通用服务器,它去掉了通用服务器原有的不适用的大多数计算功能,而仅仅提供文件系统功能,用于存储服务,大大降低了存储设备的成本。为方便存储到网络之间以最有效的方式发送数据,专门优化了系统硬软件体系结构,多线程、多任务的网络操作系统内核特别适合于处理来自网络的I/O请求,不仅响应速度快,而且数据传输速率也很高。与传统以服务器为中心的存储系统相比,数据不再通过服务器内存转发(这会引起额外延迟和阻塞),直接在客户机和存储设备间传送(即所谓第三方传送),服务器仅起控制管理的作用,因而具有更快的响应速度和更高的数据带宽。另外,对服务器的要求降低,可大大降低服务器成本,这样就有利于高性能存储系统在更广的范围内普及应用。
在NAS方案中,存储设备在功能上完全独立于网络中的主服务器,客户机与存储设备之间的数据访问已不再需要文件服务器的干预,允许客户机与存储设备之间进行直接的数据访问。利用专用的硬件软件构造的专用服务器,与其它资源独立,不会占用网络主服务器的系统资源,不需要在服务器上安装任何软件,不用关闭网络上的主服务器,就可以为网络增加存储设备。服务器则从原先的I/O负载中解脱出来。另外,它具有较好的协议独立性,支持Unix、NetWare、Windows NT、OS/2或Intranet WEB的数据访问,客户端也不需要任何专用的软件,安装简易,甚至可以充当其它机器的网络驱动器,可以方便的利用现有的管理工具进行管理。与传统的通用服务器不同,NAS专用服务器能在不增加复杂度,管理开销,降低可靠性的基础上,使网络的存储容量增加,具有非常好的可扩展(Scalability)。由于不需要服务器提供更多的硬件及服务,使服务器的可靠性和I/O性能大大提高,能充分利用可得到的10M~100MB网络带宽,有较大的数据吞吐量。
NAS可以通过集线器(Hub)或交换机(Switch)方便地接入到用户网络上,是一种即插即用的网络设备。为用户提供了易于安装、易于使用和管理、可靠性高和可扩展性好的网络存储解决方案。
NAS使文件访问操作更为快捷,并且易于向基础设施增加文件存储容量。因为NAS关注的是文件服务而不是实际文件系统的执行情况,所以NAS设备经常是自包含的,而且相当易于部署。
NAS设备与客户机之间主要是进行数据传输。今天在LAN/WAN上传输的大量数据被分成许多小的数据块。传输的处理过程需要占用处理器资源来中断和重新访问数据流。如果数据包的处理占用太多的处理器资源,则在同一服务器上运行的应用程序会受到影响。由于网络拥堵影响NAS的性能,所以,其性能局限性之一是网络传输数据的能力。此外, NAS存储的可扩展性也受到设备大小的限制。增加另一台设备非常容易,但是要像访问一台机器上的数据那样访问网络环境中的内容并不容易,因为NAS设备通常具有独特的网络标识符。由于上述这些限制,NAS环境中的数据备份不是集中化的,因此仅限于使用直接连接设备(如专用磁带机或磁带库)或者基于网络的策略,在该策略中,设备上的数据通过企业或专用LAN进行备份。
与SAN不同,NAS是部件级的存储方法。NAS将存储设备通过标准的网络拓扑结构连接到一群计算机上,所以NAS在适用性方面具有不少优势。首先,NAS可以无需服务器直接上网,不依赖通用的操作系统,而是采用一个面向用户设计的、专门用于数据存储的简化操作系统,内置了与网络连接所需的协议,因此使整个系统的管理和设置较为简单,其次NAS是真正即插即用的产品,并且物理位置灵活,可放置在工作组内,也可放在其他地点与网络连接。
NAS没有解决好的一个关键性问题,是其在备份过程中的带宽消耗,网络带宽要同时满足存储和正常的数据访问。现在,一个比较一致的看法是:NAS可以很经济地解决存储容量不足的问题,但难以获得满意的性能,对于关键事务应用而言,它必须使用专用的宽带网段; 因此,如果公司的发展将需要大量的NAS设备或是网络带宽需求超过千兆以太网,就应该考虑最高端的存储解决方案SAN。不过,从适用性和TCO的角度出发,NAS依然应该是国内多数企业的首选结构。
NAS网络附属存储分类电器型服务器电器型服务器是NAS系列设备中最低端的产品。与本文中的其他存储方案不同,电器型服务器不是专门附加的存储设备。它们为网络提供了一个存储的位置,但是由于没有冗余的以及和高性能的组件,它们相对比较便宜。如果你十分注重高可靠性或一流的性能(而且你愿意为此多花一些成本),还是应当考虑NAS类的更高端产品。但是,因为电器型服务器担当的是其他网络设备的主机的角色,而且它们十分易于安装和管理,所以对拥有有限IT资源的较小企业和远程办公室来说,它们是一个很好的选择。
在工作组环境中,电器型服务器要起很多作用。典型服务包括网络地址翻译(NAT)、代理、DHCP、电子邮件、Web服务器、DNS、防火墙和VPN。简而言之,电器型服务器几乎提供了小型企业或远程办公室运行配备Internet连接功能的小型网络所需的所有一切。这类产品分别来自Promise、Cobalt、Compaq、Extended Systems工作组NAS工作组级的NAS特别适合于存储需求相对较低的小型和中型公司,它们的存储需要一般从几百GB到1TB。运行电子商务软件或者大型数据库的公司会需要几TB的存储空间,他们使用的属于中型NAS。 一般来说,当从工作组升级到中型NAS时,你会发现热插拔驱动器和一些可以放置额外的驱动器或更多的故障恢复产品的设备盒、增强的管理功能以及系统复杂性的少许提高。
装备在一个机构中最常见的网络存储系统是文件服务器。研究显示,市场上多达60%的通用服务器都被用作文件服务器。而实际上,用通用服务器作文件服务器并非最有效的网络存储解决方案。网络附加存储(NAS)正是为解决在资本投资和简化专业人士管理工作中出现的这一问题而设计的。装配NAS只用几分钟的时间,无需关闭现有的网络服务器,更不用花费几个小时、甚至几天的时间装配一个多用途服务器。中型NAS我们所说的中型NAS解决方案提供了更好的扩展性和可靠性,而且有着与低端NAS类似的优点,例如方便、专用的存储空间和简单的安装和管理过程。与电器型服务器(1,500美元到2,500美元)和工作组级NAS(3,000美元到10,000美元)相比,这些NAS设备(20,000美元以上)的成本明显要高很多。中型NAS产品包括Compaq TaskSmart N2400、Network Appliance的低端型号和Procom NetForce产品。以Compaq TaskSmart N2400 (34,711美元)为例。该设备实际上是一台Compaq服务器,它运行了为文件共享而优化并且为易于管理而修改过的Windows 2000的某个版本。该系统包含一台ProLiant服务器,配置为双733-MHz Pentium III处理器、1GB ECC SDRAM、StorageWorks硬盘。这些硬件部件都能从Compaq单独获得。服务器本身可以配备最多四个热插拔18.2GB Ultra3 SCSI硬盘,总计存储容量可达72GB。这些组件都是机架安装式的,服务器及硬盘存放盒总计占用6U高度。它可配一个磁盘存放盒,其中装满了全部14块硬盘,原始存储容量达252GB。当配置四个磁盘存放盒并完全装满36.4GB的硬盘时,该系统的最大存储容量为2TB。各磁盘通过一个四通道Compaq SmartArray 4200磁盘控制器从后部连接到服务器上。除了磁盘子系统使用RAID方式提供数据的可靠性,该服务器本身还具有高可用性。它的操作系统运行在服务器中两个附加的热插拔、互为镜像的18.2GB硬盘上,每块硬盘都有自己的风扇和电源。当配置为网络协作(network teaming)时,4端口网卡可以提供故障冗余和负载平衡。大型NASEMC把Clariion系列产品定义为“中型”信息存储系统,但是为了符合本次专题的一致标准,我们将其列为更高端的产品。不过,就存储容量和价格来说,EMC的谦虚是这类产品最高能达到什么水平的一个信号。
对于这类存储设备,系统的易扩展性以及高可用性和冗余性都是十分关键的。同时,这些设备还必须提供高端服务器的性能、灵活的管理以及与异类网络平台交互的能力。 EMC CLARIION FC 4500 和 FC/IP 4700即是此类设备的代表。EMC Clariion FC4500(直销价为93,400美元)是一套包含了机架的机架安装式设备,它提供了基于光纤信道的磁盘存储空间。该解决方案有两种机架型号:39U全高固定机柜和20U高台式机柜。其中39U型号配置了30块18GB 10,000转/分的Quantum热插拔硬盘。它的机箱支持最多十个磁盘存放盒,每个存放盒可放置多达十块硬盘,最高可提供达到7.3TB的存储容量。
EMC发布了其第五代Clariion产品(4700系列)。该公司把IP4700/FC4700称为“业界的第一个多型号SAN/NAS存储解决方案”。由于该系统“象变色龙一样的”架构,用户既可以在NAS配置(IP4700)中也可以作为SAN的一个组件(FC4700)使用同样的Clariion 4700系统。要实现NAS,可以换下存储处理器并增加一个速度为1Gbps的Ethernet网卡。 在其他方面,4700非常类似于其前一代产品—虽然4700提供了新的高性能多CPU存储处理器、2GB高速缓存、4个前端和4个后端光纤信道连接以及每个存储处理器都有的冗余路径。
让EMC区别于其他对手的特点在于其提供的高水平服务和技术支持以及Clariion管理软件强大的异类网络连接能力。EMC标准的两年保修为关键应用提供支持,其中包括2小时内修复的保证。
NAS虚拟化NAS虚拟化,一种将多个NAS设备集聚成一个单一的、抽象的实体的方法就是NAS虚拟化。最简单的NAS虚拟化定义指的是使用某些方法来使多个NAS设备呈现出一个单一的NAS形式。客户的理想就是使各种不同类型的NAS设备能够集聚成一体,从而提供与各个独立的NAS设备相比的更多的好处,获得一个好处扩展集。成长型商用网络企业的存储首选目前,对于大多数中小企业用户来说,海量数据存储已成为客户急需解决的问题。事实上,这也是中小型用户目前所面临的最大挑战。中小企业的员工数量通常只有几十到数百人,没有专门的技术人员来管理不断增长的数据。因此,这些客户通常采用权宜性的存储方法,简单安装PC文件服务器来解决出现的问题。但这种方式通常会导致可用存储空间使用率的低下,以及极高的成本,系统管理员需要管理多个PC文件服务器及日益复杂的存储系统。这种方式还会导致坏数据或数据错误,很多公司无法承担由此而导致的经济损失。
为了应对上面情况,将数据转移到网络中是一个好的解决方案,网络存储是未来的趋势,也是存储的基本组建模块。
目前主流网络存储技术主要有NAS和SAN两种技术,两种技术各有优势,并无本质上的优劣之分,只是分别适用在不同的场合。因此在对比网络存储技术之前,我们首先归纳一下中小型商用企业的特点,以及他们对存储设备的要求。这样就可以选择出最适合中小型商用企业的网络存储技术。
中小型商用企业数据管理的现状及要求:
企业资金有限――>要求网络存储系统价格不能太高。
企业规模不大,员工人数在几十到百人之间――>要求数据存储量在几百G到几个T之间
没有专门的网络存储管理人员――>要求存储设备要设置简单,容易操作
规模虽小,但业务部门繁多:研发部,技术部,商务部,财务部等等,不同的部门可能使用不同的操作系统――>要求存储设备能跨平台,最好能同时兼容多种操作系统。
企业成长快――>要求存储设备扩容简单,扩容成本低。存储介质(硬盘)应该为价廉物美的大众化产品
可以利用现有网络,使用简单,最好能即插即用――>要求存储设备能够基于现有IP网络,安装存储设备不改动企业现有的网络架构。
SAN存储技术实际上是一个通过高速电缆(也被称为光纤通道)连接到服务器和交换机的专用存储设备(磁带或磁盘)网络。存储区域网络(SAN)把数据以块为单位进行管理,采用具有更高传输速率的光纤通道(Fibre Channel)连接方式和相关基础结构。它的设计和实现途径为它带来了更高的处理速度。SAN存储可以提供高速的数据传输率,但是SAN构架的存储网络需要专业的技术人员管理,为了充分提高效率,SAN需要配置专用的光纤通道交换机及相应的小型机作为服务器,以向外提供数据访问。从效率出发,SAN存储系统一般都采用高速SCSI硬盘,性能很高,但是也大幅提升整个数据存储系统的造价。SAN采用基于块的存储方式,不同格式化的卷只能为对应操作系统独享。这样如果企业中存在不同的计算机操作系统,而且要实现数据互相访问,那么对网络存储管理人员的要求是很高的。在过去的几年中,高速SAN存储一直是大型企业和机构关注的领域,因为只有这些大型公司才拥有创建SAN所需的资源
NAS也是网络化的存储;不同之处在于,它所连接的网络是局域网(LAN)而非存储网络。NAS是一种专用的文件服务器设备,可以为工作组或公司中的每个用户提供共享磁盘空间,用户权限设置思路很类似于普通Windows系统,操作很简单。与通用服务器相比,NAS较便宜,且安全,日常管理更方便。NAS基于IP网络,在数据传输时对带宽资源有较大的占用,但随着千兆以太网技术和一些新技术的发展,NAS在网络传输速度方面的不足有较大的改观,而且NAS设备一般采用标准的硬盘(SATA,IDE),配合厂商的专利技术,存储系统扩容比较容易,零配件的更换成本很低。只需一个IP地址即可访问NAS,避免了客户端大量的设置工作,为将来更大的数据存储提供了一个简易的增容方案。适合于数据量每年都有增长的成长型中小型企业使用,企业不必一次性购买大容量的存储系统,而是可以根据自己的需求逐步扩充存储系统。NAS存储系统内置了服务器功能,它能够兼容不同的计算机操作系统,同时基于IP的特性使得NAS系统可以无缝地融合到现有网络中,安装NAS系统不会对企业现有的网络系统做任何更改。通过下面的表格可以比较清晰的看到在中小型成长企业中NAS存储的优势。正确使用NAS网关的方法文件管理已经成为各大企业最头痛的难题之一。文件应当如何进行保管?存放在哪一级磁盘上是合适的?除此之外,还要兼顾其它方面的考虑,比如说遵从和应对相关的法令法规及行业规定。部署连接SAN存储的NAS网关,就是一个不错的解决办法,使得管理人员能够将分散的NAS filers整合在一起,增强了系统的灵活性与可伸缩性,为企业升级文件系统、管理后端的存储阵列提供了方便。不过,使用NAS网关也会引发一系列的新问题,比如说,NAS网关是通过IP网络连接到基于光纤通道的磁盘阵列上的,容易发展成为性能瓶颈或单点故障,企业用户在部署网络时应该好好规划一下。
在高端的NAS应用中,往往会采用NAS机头(NAS head)作为NAS服务器的控制端,光纤磁盘阵列通过SAN或DAS连接到NAS head上,为其提供高性能、大容量、高可用性的存储后端。目前市面上出售的NAS机头主要有两类。一类是与磁盘阵列捆绑在一起的大型存储子系统,比如说NetApp公司出品的FAS980系列;一类是独立的设备,比如说NetApp的gFiler,能够将不同类型的存储阵列、多层存储,甚至于不同厂商的存储设备连接在一起。值得一提的是,以上两类产品都是通过光纤通道与后端的磁盘阵列相连接的。
使用独立的NAS网关来整合现有的NAS filers,可能引发的问题包括如下:
如果许多用户同时访问磁盘阵列上的文件,将导致系统性能下降,此时可能需要重新给用户分配网络存储资源;
系统中可能会出现许多名称相同但存取及修改时间不同的文件,管理起来会比较麻烦,需要编制目录,确定文件的创建人;
根据磁盘的类型和性能级别,存放不同的数据。由于NAS网关加入了对iSCSI协议的支持,许多企业纷纷选择它来完成文件级别或数据块级别的传输服务;另外,它还能够动态地为后端存储阵列上的数据重新进行分类,优化了新旧数据的性能。实现对异构系统的支持,已经成为NAS网关供应商们的发展方向,随着它们的产品获得越来越多的磁盘阵列制造商的认证测试,用户再也不用局限于一家厂商生产的磁盘阵列产品了。而且,越来越多的供应商现在也陆续增加了对多层存储及各类策略管理工具的支持功能,使得不同存储层之间的数据迁移过程变得更加透明化。鉴于市面上的NAS网关产品的品牌和型号挺多挺杂的,建议用户们在选购时,评估产品性能一定要分清主次,务必包含以下关键配置和性能:
用于连接服务器的以太网端口
支持NFS协议和CIFS协议
支持多层存储
可依照用户制定的策略来管理数据
具备诸如快照复制、建立镜像之类的高级存储管理功能
除此之外,结合企业未来的发展需求,可将下列性能指标也列入评估范围内:
支持iSCSI技术
可将NAS网关与外部存储阵列连接在一起的光纤端口
可支持不同品牌的磁盘阵列
可动态地配置和扩展卷和文件共享的资源
对后端磁盘阵列上的数据重新进行分类
与远程站点共享文件
支持全局命名空间SAN和NAS的区别存储区域网络(SAN)和网络附加存储(NAS)是相互竞争的两种网络存储技术,实际上,它们可以很好地相辅相成,用于存取不同类型的数据。NAS设计用来在文件这个层次上存取数据,而SAN最适合用于高容量数据块的传输。
这两种技术都能满足消除存储器到服务器的直接联系的需求,有利于更灵活的存储访问,另外,SAN和NAS都是基于开放的行业标准网络协议——用于SAN的光纤通道协议和用于NAS的TCP/IP网络协议。SAN支持的应用软件范围宽广,其中包括提供对NAS软件的存储,而NAS一般被限制在文件层访问数据的软件。撇开SAN和NAS的区别,它们都在今天的企业中扮演着至关重要的角色,而且提供了许多优点,这些优点是传统的服务器附加存储实现方案无法提供的。
SAN的主要特点
SAN设计用来提供灵活的、高性能的和可伸缩的存储网络基础结构。SAN提供了许多在存储装置和服务器之间的直接连接来实现这个目的。这些存储装置包括磁盘存储系统和磁带库。
高性能的光纤通道交换机和光纤网络协议确保了设备连接的可靠和高效。这些连接基于固有的光纤通道和SCSI(通过SCSI到光纤通道转换器和网关)。一个或更多的光纤通道交换机在主服务器与存储设备之间提供相互连接。主服务器与存储设备放置在被称为”SAN组织结构”的网格拓扑结构内(见下图)。
减少网络阻塞的SAN基本结构
因为SAN通过最优化处理来达到在服务器和存储装置之间传输数据块的目的,所以它在很多方面的使用效果都很理想,例如:
处理关键任务的数据库软件。关键任务是指响应时间要能确定,实用性和存储的可伸缩性
集中化的存储备份。这主要要求操作性能、数据的完整性和可靠性用来确保关键的企业数据的安全。
高可用性和应用软件故障恢复环境。这可以确保以较少的开销,使应用软件的可用性得到极大的提高。
可伸缩的虚拟存储。它将存储与主机的联系断开,能动态地从集中存储地分配存储量。
提高了故障容错度。可在远距离(最远达150km)的主服务器和连接设备之间提供高性能的光纤通道传输。
SAN的主要优势
由于SAN提供了优异的可伸缩性,所以它逐渐成为那些正面临着数据存储量快速增长的大型企业和服务提供商在网络基础设施方面的选择。实际上,相对于传统的存储体系结构,SAN具有许多显著优点。例如传统服务器附加存储很难进行更新和集中管理。如果要真正增加存储器和配置新存储器,必须要关掉每一台存储器。相比之下,SAN提供了一种方法可以避免像服务器附加存储那样的停止工作和存储结构瓦解情况的产生。SAN还有助于数据的集中化管理,而这样可以大大减少整个操作开销。
使用光纤通道调节技术,SAN可以优化高效的数据块传递。通过支持包含在存储器和服务器之间进行高容量数据块传递的软件,SAN提供了简化数据备份操作的方法。所以传统上用于数据备份的宝贵的带宽可以替换到更有战略意义的应用软件上。
开放的、具有行业标准的光纤通道技术也使SAN极具灵活性。通过克服传统上与SCSI相关的电缆限制,SAN不但允许更多的连接,而且大大增加了存储器和服务器之间的距离。改进的可伸缩性简化了网络服务的使用和可扩展性,从而提高了最初的硬件投资回报。另外,SAN提供了在网络环境中更高层的控制,用于满足基于事务处理的系统在性能和可用性方面的要求。这类系统一般要求有很高的可确定性,在软件性能上不允许宽范围的变动。SAN通过使用高可靠性和高性能的光纤通道协议满足了这一需求。
SAN的另一大优势是能将数据块高密度传递。由于在发送时数据被分割成的段数更少,所以在数据传输过程中,SAN减少了预先对通信节点的处理(服务器尤其如此)。因此,光纤通道SAN在传输大量集中的数据块方面要有效得多,而正是这一点使得光纤通道协议可以理想地应用于存储空间比较紧张的情况。
今天,SAN正在与NAS环境一起用来为NAS设施实现高性能、大容量的存储库。实际上,许多SAN现在都隐藏在NAS工具的后面,用来强调关键数据的存储可用性和备份要求。NAS网络附属存储应用软件及其好处能在SAN环境中实现的一个主要好处是它大大提高了企业数据备份和恢复操作的可靠性和可升级性。基于SAN的操作可以在减少整个网络上发生的通行数量的同时,显著地降低备份和恢复时间。
当SAN通过城域网的基本设施扩展时,它可以通过与远程设备的无缝联接来提高故障容错度。SAN运用MAN的基础设施可以将SAN的组件距离增大至150km,而性能丝毫不降低。各种组织可以通过使用故障恢复设备,利用上述功能来提高故障容错度。这些故障恢复设备用于执行关键任务和为关键应用服务器进行远程数据备份。
另外,基于事务处理的数据库从SAN的使用中获益匪浅。无缝地添加存储器,提高数据备份的时间,保证了预期性能的级别,这些能力对全面提高事务处理软件的可靠性、实用性和服务性大有好处。而且,消除了直接的存储器到服务器的联系,SAN也能显著地减少每台服务器备用存储的数量。
SAN还提供了更划算的方法来实现高实用性软件的需求。传统意义上的高实用性的配置要求在高实用性服务器组中为每一台服务器提供一台热备份服务器(hot standby server)。而SAN通过消除存储连接的限制,实现了用一台单备份服务器支持多个主要服务器。
改进的服务器可用性和更有效的存储能力减少了服务器所有者的花费。
SAN和NAS的许多传统意义上的区别正在开始消失。例如,NAS软件逐渐使用SAN解决与存储扩展和数据备份/恢复相关的操作方面的方法。虽然这两种技术有相似之处,但是NAS却不能提供所有SAN可提供的商业利益。然而与传统的服务器附加存储相比,SAN和NAS技术都能为所有者减少整个开销,提供更好的更全面的投资回报。