下午分会场一文字实录:Power聚能,系统先行-- IBM Power Systems 详解专场

  Power平台上的存储解决方案---IBM存储产品经理金微

  金微:大家下午好。我们从国内的客户,2006、2007年两年看,IBM占据外置磁盘存储市场份额的领先地位,06年和07年对比增长了3%几的份额,这个数字是根据IDC2006、2007年的数据得来的。

  IBM的存储部门也在不断的整合。在国内有独立的存储部门,差不多是1997年成立的,虽然IBM在50年代已经有的产品。十年前我们的产品线非常单一,现在来说存储产品线非常多,我把它分成几类:第一类是大家熟悉的磁盘系列,第二类是磁带,磁带在IBM占有非常重要的位置。第三,IBM和存储相关的服务,在中国地区这块相对于硬件和软件没有那么大,但是也是比较重要的。其次,还有IBM结构管理的软件,包括TPC、做数据备份的TSM和CPP都是属于我们的存储软件部分。

  作为一个存储的部门来说,或者说客户用存储的时候,其实它并不是完全能够解决你业务上很多东西的方案,但是去年开始我们希望这四个方面引起客户的注意,第一是成为存储HA,存储本地也需要HA的结构,可能灾备的时候也要用HA。很多用户环境从传统的晚上休息的,变成了7×24的环境,这样我们建议客户采取两套存储。虽然存储本身的设计是双份的,但是如果处于维护状态或者病休状况,你又是7×24小时不能停机的环境下,建议你有备援,在机器做休息的时候可以替上。另外一个原因现在自能化存储的代码越来越复杂,从存储里面两个芯片到现在存储里面有上百万的代码,大家做软件有知道,软件代码太长以后,有一些异常是没有办法百分之百避免的,因为有些异常是你现在预想不到的,这样单套存储就有潜在的危险,软件会不会有bug,有bug怎么处理。另一方面我们持续的帮助客户做业务连续性,业务连续性是避免因为存储或者本地的小灾害引起的业务不可用,这是通过存储备份或者远程复制的手段达到的。

  第三个解决方案,就是数据生命周期管理。我们希望通过IBM的各种层次的硬件和软件,在数据不同生命周期根据它的价值放在不同的存储上。

  第四,虚拟化。用户已经有比较多的存储设备EMC HP等等,这时候要管这些东西,存储虚拟化简单讲就是用统一的存储控制器,把所有想管理的存储的智能都集中,由它重新把分散的存储变成一个磁盘阵列,另外它有很多好处,比如说透明的数据迁移、方便的数据复制。

  这是我们在存储领域比较注重的四个解决方案。2006年开始到2007年持续发展的是关于IT业要节能减排,就是所谓的绿色存储,也出现了绿色服务器。绿色大家想到的就是几个方面,耗电少一些、散热好一些、冷却好、这些讲的确实都对,我们IBM也是根据这些情况去设计和制造我们的产品。另外也做了软件的动作,出了电源管理软件,可以看哪些设备最耗电,可以帮助客户很快提高存储利用率。

  我们想实现绿色存储是通过几个手段,选择能耗设备更低的设备,除了DS8000以外,另外一个通则是的慢速的存储耗电也少,另外提高磁盘阵列利用率,如果企业环境里面有30个阵列,每个阵列是20%、30%的利用率,但并不是20%、30%的耗电量,只要开了就会耗电,我们希望集中的模式和容易分配资源的模式提高利用率。

  第三个方面,通过软件上的一些手段避免客户没有必要的消耗很多的硬件资源,我们每个人都用过压缩,压缩就是用少量的硬件实现更多存储的手段。比如说防数据重复存储,避免重复的部分,省下大量的物理空间,这样就可以节电。另外分配方式,我们的SVC和DS8000都有瘦供给,现在很多存储集中环境,多台服务器共享一个服务系统,每台服务器因为应用的需要,它要100G的数据存储空间可能要200G的分配给它作为比较安全的保护。瘦供给的方式就可以很好的调配资源,瘦供给实现了真正按需要分配空间。

  IBM目前的存储产品线分成三条主线,DS系列,最高端是DS8000,中端是DS4000产品,中低端是DS3000,主要用于X86、PC服务器市场。DS4000是纯光纤的,DS8000也是纯光纤的。还有一个产品线我们没有真正开始销售,今年年初我们购并以色列一家公司XIV,这家公司的创始人就是EMC高端存储的发明人,他自己做了一套系统,这个系统是集群化的存储系统,这个系统目前还没有到我们的产品线中做,因为它面对的是比较特殊的群体。

  DS8000是我们最高端的产品,目前保持着490万的最高IOPS,DS8000是高度集成化的系统,其他系统是继续采用用大量类似于单片机的系统管每一块职责,通过一些交换机把这些东西联合成一个大的体系。DS8000不是这样的,它是用两套服务器的体系去高度集成的事情。DS8000现在在我们省一级的集中或者比较大型的金融机构都有广泛采用。

  今天的主题是面向成长型企业,DS8000就不做过多介绍了。在管理方面,IBM有SSPC,它有一个统一的界面,可以看到DS8000、DS4000和IBM磁带库,客户根据购买软件的情况激活相应的部分。

  在中、低、高端产品就是DS3000/4000系列。DS3000主要定位是X86服务器,DS4000有4700和4800的型号,它的定位主要是UNIX小型机和部分的X的机器。DS4800一共有四个型号,这个指标我刚才每一个都念了,4800里面目前这几个数字,比如说最大Cache、每秒I/O处理能力,最大的磁盘I/O处理能力都是相当不错的,我们可以比较一下同类的几个产品。DS4880的发明和其他三款略不同的,它是入门级的磁盘,它的最大Cache指标也是小一些。这几款4800的型号速度各方面都一样,只是缓存不一样,所以决定了它出现了三个型号。

  DS4800系统的设计也不同于4700和其它的系统,它的里面有两套CPU,一套是数据处理的,一套是控制系统,很少有系统是这样分开做的。它的控制系统用的是英特尔至强CPU,而数据处理系统用的是另外一个比较专业的CPU。

  DS4800的架构。(图)做数据处理从这边进来,进来以后通过引擎做处理,然后写到后台磁盘中去,客户购买的缓存就是指这个数据专用缓存,后面说购买的8G缓存完全是有8G是用于做数据的,不会有任何的内部损耗,因为内部的系统管理运行是由另外一个控制器,英特尔的至强芯片就在这里,它有1G内存用于控制整个系统,是这样分开的设计,这样使得它的后台I/O处理很不错。

  DS4800的连接,DS4800的后部通道是8个4GB的光纤,市场上很多同类的产品也是8个,但是4800最大的磁盘数只是它们的一半,就是为了避免在每个通道上面有太多的磁盘影响速度。同时,4800的连接方式比较有意思,这是它的扩展汇,连完A连B,顺序的连着A、B、C、D,它有一条线是从控制器开始,这样的次序,另外一条线是倒过来的,这个环路里的最后一个是另外一个环路里面的第一个,这样有什么好处呢?如果4800里面有一个扩展汇突然断电,扩展汇突然抽调,或者突然消失,它的上下扩展汇继续控制连接,这也是比较独到的方式。

  DS4700是定位比DS4800更低的用于UNIX小型机的磁盘阵列。它的容量和速度是4800的一半。它的容量112块盘,Cache也有两个型号,72型号是4G,70是2G,这两个主要的区别是Cache。4700和4800内外都是4GB的,它们同时支持光纤和SATA的驱动器,SATA接口和光纤根本不一样,为什么可以插在一个扩展汇里面?在4000里面,可以把SATA盘接口作为光纤的处理,所以可以和光纤一起插在扩展汇里面,这对于用户有些分级应用比较好处理,比如一些归档的数据需要放在盘阵上,但是又不想另外购置一个SATA盘阵,就可以在一个盘阵里实现。

  DS4700的核心芯片不像4800是独立在两块,有RAID处理,有自己的控制处理,它是一块芯片,这块芯片是英特尔xScale系列的芯片,这也是英特尔为数不多的RISC芯片。DS4000也有直流电,主要用于电信行业的用户,DS4800没有直流电的信号。

  (图)DS4700的结构。结构看比较简单,是xScale的核心CPU。4700比较紧凑,它的控制器里面可以16块插盘,4800控制器是不能插盘的,是通过扩展汇连接的。DS4200和4700差不多,但是只是纯SATA盘阵的,它的价格上更低廉。整个DS4000的管理是随机会存储管理软件,它可以做很多事情,除了标准的磁盘定义外,还有一些功能很不错,而且其他软件很少会实现,比如说动态的RAID组的改变,方便了用户使用方式的改变。

  在动态方面还有其他很多的帮助,比如说要加一些磁盘扩展逻辑卷的时候不需要停机,都可以去改变,另外远程复制模式也可以动态的改变,不需要停下来做。

  DS4000的存储分区,这是DS4000用来指定哪些盘给哪些服务器使用的方式,它是为了避免不合适的服务器访问到不合适他的磁盘,所以要做出分区,这和在其他的盘阵里叫存储映射,是差不多的目的。

  DS4000里通过控制器有两种高速复制盘卷的工具,一种叫FlashCopy,一种叫Volume Copy,FlashCopy只是复制指定卷的指针,FlashCopy大家可以理解为和我们平时用的复制命令一样,指定一个盘复制,完全复制出去,它的复制速度非常快,可能100或者200G的卷几秒就可以做完,而实际拷贝要两一小时。指针复制出去以后对外部来说是透明的,他并不知道复制的只是一些指针,但是内部只是做了指针的复制,以后这两个卷如果有任何的更改,它会另外找一个空间记录下来更改的部分,它内部知道这是一些指针构成了比较虚的卷。卷拷贝是百分之百的物理拷贝,并没有指针拷贝,一般指针拷贝和Flash拷贝是结合在一块的。

  一般DS4000也有远程镜像软件,主要是通过磁盘阵列实现两排盘阵之间的复制,它的目的是灾备系统或者数据集中保护或者是数据迁移,比如说从这个楼的4000迁移到另一个楼的4000,这个动作是存储控制器做的,不需要服务器干预,好处是不管是什么服务器,只要放在4000就可以复制到远程去。搬过去以后是原封不动的卷,就好象做了磁盘拷贝一样,它做复制有同步和地步两种模式,同步是保证两个地方的盘阵完全同样的数据,异步是两面有一定的延迟,但是异步对中间网络带宽和距离要求不高,如果距离比较远,带宽又不够,可能也能做,同步的话,如果距离太远就不能做了。异步模式又细分两类,一类是数据迁移的,它不保护数据的一致性,它传到远程的数据可能有一点差异,远程收到数据的次序和本地有可能有点不同。还有一种模式是保持一致性的,虽然远程作为异步的目标卷,它和本地的卷是有差异的,但是次序是一样的,逻辑性还是对的。保持一致性的异步,主要用于远程的灾害保护领域,不保持一致性的异步方式速度比较快主要用于数据迁移的领域。

  刚才介绍了DS系列的4000和8000。DS3000系列目前是针对PC服务器的连接,所以不在这里介绍了。下面我们说一下IBM N系列的网络存储,因为每一款N产品的标配都有IP端口,所以称之为网络存储。N系列的产品线分成3000、5000、7000三大类,相当于低、中、高的档次。还有一个系列是不带磁盘的系列,叫N Series Gateway,它的磁盘是连接一些客户现有的磁盘和磁带来实现功能,这个系列有什么特色呢?这个系列也是盘阵,但是它的策略是同时支持多种协议,光纤、NAS,刚才说CIFS、NFS都是典型的NAS的协议,iSCSI是文件传输的协议。另外它和很多软件都有结合,和甲骨文、SAP的软件都有结合,有结合的意思是说,这些软件它可以利用到存储上一些的功能去做高速的备份或者恢复。扩展性也比较强,硬件从低到高,跨度很大。可靠性上,N系列很早就出现了双校验的技术。如果有特殊环境要求,N系列还可以做异地的远程集群,比如说本地一台存储突然宕机远程可以把所有的IP地址都接管过去。这是全能存储的概念。

  在全能存储里面也有不同级别的,有高速的光纤磁盘,有SATA磁盘。全能存储的功能比较全,典型的应用是一套存储可以同时满足光纤、iSCSI和NAS不同的需求,同时自己的功能可以把数据复制上去,而且可以利用一些信息,不需要人员。

  由于它是一个网络存储,它也适合一些视频监控领域,可以通过网络视频监控,把计算机设备集中。邮件一体化。N系列做Exchange有一个好处,除了它比较快,它还有一个功能是可以快速的备份和恢复,大致的意思是可以正确的利用N快速的回复功能,高速的把备份E的版本很快找到出来,不需要管理员把备份服务器存储到某一个地方,在打开某一个邮件才可以做到单个邮箱级的高速恢复,这是不太容易做到的。

  同时它适合一些中小型的企业做远程的灾备系统。它本身的供应比较全,它有异步和同步的远程支持,带宽可以是支持的IP,4000、8000的支持。IBM的虚拟存储。它的特色是适合环境比较复杂的客户更好地把它的异构存储集合起来变成一个存储来使用。

  磁带。磁带并没有慢慢的衰弱下去,反而是慢慢的发展,这是两大原因,客户有越来越多的数据不太常用,但是又不向删除,这样的数据放在磁带上非常适合。第二,磁带技术不断地发展,现在四代磁带刻录机速度的10倍以上,容量是20倍,这样的前提下可以大量的归档数据可以放在磁带上。磁带可以保存30年时间,并不比其他的介质差。

  磁带保存数据是最节能省电的模式,搬运起来也比较方便。磁盘有一个天然的缺点,它是一个顺序设备,比如说你要回复数据要大量的时间找,但是磁带产品家族主要是LTO系列,从单控、双驱、四驱的44个槽位一直最大300多个槽位,还有最大的是6000个槽位。另外还有虚拟带库系列,用磁盘模拟带库实现比较高速的恢复,或者说大量的琐碎的恢复。

  IBM在4月份宣布收购了Diligent公司,这家公司有一个核心技术是做重复数据删除,这个技术可以用在IBM虚拟带库里面,以后也可以用在我们其他的在线存储里面,比如说4000或者8000。IBM现在的虚拟带库在指标上可能业界最大的虚拟带库,无论是容量还是持续速度都是非常惊人的系统。

  IBM的LTO系列和IBM的专用的三个主要系列都支持加密,加密的是保证即使磁带丢失了,有人捡到了,他也读不出数据,因为加密了,它的密钥文件是在服务器,没有密钥几乎是没有办法解开这个数据。现在的LTO4的速度是120MB/s,压缩的容量是800GB,压缩了三倍,而且支持加密。虽然大家都是通用的LTO技术,但是IBM的LTO是有特色的,它的磨损比其他驱动器要小,它的搜索带的时间比较短,它有无极变速的系统,可以把磁带的转速降下来。

  SVC虚拟化是用来简化客户环境的,我们看一个例子,某个税务系统的客户,他有一个老的DS4000系统,又购买了新的DS4000系列,在200公里以外的地方用SVC做了远程灾备,好处是原来这里摆两套4000,这边也要摆两套4000,必须是4000,现在用这个核心系统以后,数量不一定对称,而且型号也不一定对称,在灾备上更加灵活一些。

  XIV是我们最近收购的一家公司,有一个集群的存储架构,比较适合于Web2.0架构或者特殊的行业。

  最后感谢大家参加今天的会议,谢谢。

  主持人:感谢IBM的技术专家给我们带来的精彩演讲。