下午分会场一文字实录:Power聚能,系统先行-- IBM Power Systems 详解专场

  IBM Power服务器技术详解---IBM资深系统工程师房树新先生

  主持人:有请IBM资深系统工程师房树新先生为我们带来IBM,POWER服务器技术详解的演讲。

  欢迎各位朋友来到这个会场我们一起讨论POWER服务器的技术特点。也许有些朋友已经听了主会场的题目,有些内容在主会场已经提到了很多次,我这里尽量从技术上再具体解释一下。我本人是IBM Power服务器的售前工程师。上午大家看到这样一张图,IBM Power服务器去年开始隆重推出了POWER6服务器,现在看POWER5和POWER6有一段并行的过程。今天我们重点介绍POWER6服务器的技术特点和功能。

  从这张图上可以看到IBM 的POWER6服务器从刀片级的一个核的到四个核到八个核到十六核到六十四核全线的服务器都已经问世。如果大家在业务选型中需要用到服务器可以考虑POWER6的服务器了。但是有些机器供货有不同的时间点。

  IBM POWER6服务器推出以后对于业界引起了很大的振动。媒体上铺天盖地的看到了很多报道,POWER6服务器主频突破4GHz,目前供货的达到了5GHz的主频,它有什么样的技术可以让CPU的主频达到这么高呢?现在我们这是一个商务数据库,可以跑Oracle、DB2、Internet等等还有很多高性能计算要压在这台机器上,它的热量怎么解决的,它能不能保持一个很好的稳定性带来更高的性能,如果问到这个问题,是有历史根据的,为什么呢?我们看看这张图。

  从历史上推出计算机最核心的芯片制造技术,历史上有COMS的技术。在出现Blpolar技术的时候,原先很多大型中档机器是用的这样技术,到一定阶段很多性能再往上提升的时候,我们看到这个点,当初IBM的业绩就是Blpolar的技术,当初为了降温,这样的技术就很难在往下走下去,制造工业技术难以突破,在很多技术还是用这样的技术。

  现在的技术再往下走,比如说摩尔定律能不能再提高,性能能不能再提高,遇到了一个很大的瓶颈,就是封装技术和热量和功耗的问题。封装技术现在已经采用双核了,在一个芯片可以封装两个CPU在里面,但是巨大的热量会影响它的性能再翻番的发展。如果再往下走,怎么突破这个瓶颈呢?POWER6推出的时候就采纳了很多技术特点,能够让主频突破4GHz以上,能够从功能上、从性能上有很大的提升。这对于IBM来讲已经走到了前列,对所有芯片制造厂商来讲这是共同研究的话题。也可以看到有些芯片厂商它需要不再做两个主频以上的CPU,原因是限于厂家的技术,还没有找到更好的方法解决这个瓶颈,POWER6可以很好地解决这个问题。

  这张图简单回顾了IBM的POWER芯片的大概历史。从97年具有历史意义的铜芯片到绝缘硅芯片,到2001年IBM首先推出了双核技术,以及逻辑分区技术,后面是0.1个CPU就可以分一个分区的技术,再到并发多线程技术。以及到现在的POWER6的技术,这些都是在芯片制造上对于行业能够带来冲击的或者领头的先进技术。

  (图)这展示了不同的产品,从2001年开始POWER4到POWER6这些技术的时间点和给行业带来的不同变化。(图)这是一个芯片的尺寸,POWER4的时候两个核封装在一个芯片上,是1.1-1.5GHz的,像这样的机器在很多的企业里面还担当者重要的数据库服务器,当年的690、P690比较高档的,后来出现了POWER5到现在POWER6是一个341平方毫米、60纳米的技术,在341平方毫米上封装了8亿多个晶体管,大概尺寸我手里有一个POWER6的芯片,(图)这是POWER6芯片的图,里面有两个4.7GHz双核的CPU,还有8兆二级缓存,还有每个核里面的一个缓存,我们可以看看一代一代这样推POWER的技术,在CPU结构上有哪些大的变化。

  如果追究计算机的速度,一定要分析它的架构,就是体系结构,CPU是什么样、总线是什么样,CPU到内存是什么样,CPU到I/O是什么样的,CPU和CPU的连接是什么样的,不同的结构带来了服务器本质上的计算机处理性能。和大家讨论技术体系的时候大家觉得有点烦,我买的是应用服务器是什么呢?其实不一样,就好象购买车一样,奔驰、宝马车,但是里面的引擎系统,等等的不同才能导致车同样跑在一个路,能跑多快。这是本质原理决定的。要想让CPU有很好地发挥,这个系统一定要有平衡的设计,并不是这个机器今天插了6GHz的CPU性能就提升的很大,插了一个8GHz的CPU性能很大,你要看CPU的内存是不是完全匹配,在IBM设计里面CPU跟主频之间都保持一个一比一的配合,跟内存保持二分之一的配合,这是什么意思?每当主频提升的时候CPU到内存的速度是CPU主频的二分之一到I/O是三分之一,这样才能保持很好地平衡设计。同时它们对内存的访问、对于I/O的访问有非常大的带宽。可是各个专家采购机器的时候也要求考虑带宽是多少,如果这样考虑的用户真的是行家,因为内存带宽的速度对于数据库的应用、对于内存密集型的应用是非常重要的。

  图中画圆圈的地方都是优化的地方。从POWER5的话从三级缓存芯片这样连接直接和二级缓存相连,这样CPU的合里面一级缓存没数据找二级,二级缓存没有找三级缓存,就会找到一个延迟,降低了延迟,提高整个数据读取的速度。同时把内存控制器移到芯片里面去。到了POWER6时候,把二级缓存从1.9兆变成了8兆,从两个芯片之间共享就是小SIP的结构,变了一个光纤控制器,把内存控制器的通路进行了优化,这样这个机器的主频的提升,它的整体性能也能够匹配的带来一个提升。

  在POWER6采用了不同的封装技术,595机器采取双内存控制器,分别是均匀对称的访问它的内存,这样就能够让这些机器对于内存的访问、对于I/O的访问更加均衡、更加快。还有其他不同型号的机器会采纳其他微小的变化。在这样的CPU里面,它会共有的技术就是并发多线程技术,我们知道英特尔有超线程技术,IBM叫SMT并发多线程,通常一个CPU里有多个执行单元就是做数据处理的,比如说整型处理单元、浮点处理单元,我们抓到指令开始的时候归什么类型就放到什么单元处理。这是一个CPU的时钟周期,随着时钟周期看,比如说这是8个单元的服务器,我们看8个单元的利润率,随着时间走,用的很不高效。现在业界很多厂商的CPU,主要是看CPU内在执行单元利用率很低的。一个用户买了这样的机器,时钟单元用的不充分,这台机器的效率就低。怎么解决这个问题呢?有的厂商采纳利用编译器配合的方式,尽量在同一个周期多抓线程,但是它是靠时间错落开的,还要靠编译器,这样的技术是粗糙的多线程技术。IBM是采用了并发多线程技术,这样的技术不需要应用软件做任何改动,你跑在具有SMT的CPU的机器上,你的程序的执行效率可能会提升40%左右。这样它在同一个周期里面,可能会拿到多个执行单元在工作,对于应用来讲是拿到了两个线程。什么意义就带来你买了物理上两个核,里面可以看到四个逻辑CPU,你的数据库、自己的编写应用也会看到四个CPU,就是并发多线程技术打开的,这个可以打开也可以关,在应用过程中随时可以打开、随时可以关。

  类似于这样一个道理。(图),这是一个执行单元,它通过让同一周期可以抓两个线程的方式,对于应用来讲可以看到同样一个物理核,操作系统看到两个CPU,它在执行一个线程,它在执行一个线程,这样的应用对于Java的应用,对于并发应用度越大的带来更大的效率,比如说银行柜台的营业模式。

  POWER6相对于POWER5又进一步的优化,能够在同一周期支持7条指令,让效率得到更大的提升,大概能够提升10%左右。所以一个机器并不仅仅是靠单纯的CPU解决问题的,它是一个权衡的系统配合起来才能达到很高的性能。

  下面我们举一个实测的例子。大家可能对于Oracle的数据库很熟悉,大家可能在用9i的数据库,比如说用POWER5的570,8个CPU,64的内存跑数据库的应用,在并发多线程没有打开的时候,这个CPU可以压到90%多,它可以带700个并发用户,每秒钟做180个查询、交易、更改、操作等等。每笔响时间是0.05秒,我们把SMT技术,通过一个命令打开,就是SMT ON,数据库还在运行,CPU的利用率从90%降到60%-70%,这说明这个机器可以压更多的并发用户,我们可以继续加压,可以加压到1000个用户,这时候看它的吞吐量,每秒钟可以做280笔交易,响应时间没有衰减的情况下。同样的服务器,SMT技术和没有SMT技术可以做到从700个用户到1000个用户,从180笔交易到280笔交易的提升。如果你们买了POWER5的机器、POWER6的机器,SMT是默认打开的,通常打开是非常有好处的。

  在POWER6的一个核里面,它加了一个处理单元就是DFP(十进制浮点处理单元)。十进制浮点处理单元是干什么的呢?我们上幼儿园开始我们数数就是十进制,0到9,我们算题也是十进制,可是计算机里面是二进制表示的。计算机处理结果出来以后,可能人的理解还要转换成为十进制,这样一转换就会带来两个问题,一是精度造成了巨大的衰减,二进制浮点表示是不准确的,再就是处理速度非常慢,不知道在座有没有和钱打交道的单位,比如说财务的,卖飞机票的,和移动或者和银行打交道,你们的应用程序中,不知道你们对于钱是怎么处理的,打一个比方,比如以打电话为例,每打一个电话花0.7美金,在美国打电话是要上税的,比如说打一个电话需要加5%的税,这样打一个电话要给移动交多少钱呢?0.7×1.05,结果就是0.735。计算机表示1.05×0.7,你们回去可以编一个程序,可能取舍成0.73或者0.74,这是一个电话是这样的结果。假如一个公司是一二百万的员工,每个人都有0.005的差异,100万人会差出一大笔钱,要么是你多付,要么是你多赚了,所以二进制会带来非常不准确。有些和钱打交道的怎么办呢?利用软件包来模拟,利用软件的方式模拟十进制的浮点计算,但是模拟速度非常慢,那么怎么解决呢?在POWER6里加了一个处理单元就是十进制浮点处理单元,如果你的程序和变量中有这样的浮点,就直接用硬件做有关的运算,解决精度的问题,解决处理速度的问题。

  (图)这是一个对比。如果用硬件实现和软件模拟十进制浮点,大概是比JAVA类的应用快7倍,比C+的程序快4倍,如果在座的各位是开发C++的,你们用IBM的Compiler9编译就可以了,编译的时候加上一个支持十进制浮点的选项,就能够这样的新功能。在变量上做一个简单的变化,比如说我们以前定义的都是Floatp,现在改成decimal32、decimal64、decimal128,仅仅是改变成这样就可以了,需要打印decimal32的时候除了F表示图变成大HF,64的时候是DF,128是DBF仅仅做这样的调整就能够用到这样的功能。

  现在很多商用软件都做了调整,比如说SAP,大家有一些人利用SAP的ERP软件,它对于财务的处理、钱的处理就有很大的好处。通常双倍和Decimal128比较,通常是利滚利的算利息,算到六千万次的时候看看数据表示准确不准确。看看它的速度是怎么样。(图)这是处理结果。做编译的有DFP选项就可以,最后的结果是10×1.000001,乘了以后再累计,共做六千万次这样的累加操作。在操作之前,我们先把这两个变量打印,传统的双倍的打印出来就是10,可是1.00001,传统的双倍表示就表示成为1.0000099,根本不是1.000001,变量刚带进来的时候就不准确。

  可是要用十进制的表示方法打印,10就是10,是1.0001就是1.0001,变量表示非常准确。最后的运算结果,到了六千万次的结果你可以利用手算,结果是11419731249356,可是利用双精度的传统的二进制算结果是从第九位数就出现了差异,我们可以看到精度上表示的东西。不知道在位各位以前是否在意过,就算了一次感觉结果还行,但是如果反复的算,有可能就有这样的差异,所以回家的时候你们可以看看银行帐本的利息算的是否准确。我和一些银行用户聊天,他们每年碰到一些较真的用户,你的利息怎么调整的,银行的采取了什么样的政策,有时候很可能是编程序的时候出错或者执行规则的时候出错了,有些人很聪明的,可以算出来的,就和银行对峙。

  我们算六千万次,最后得出结果,在POWER6的机器上用0.72秒就可以算完。如果用软件包模拟刚才的结果,需要用54秒。刚才放大的这个程序是软件模拟的76倍快,这是十进制浮点的东西。

  刚才我们介绍了POWER6的CPU的结构,它带来了十进制浮点处理结构,在POWER6里面还有矢量处理单元,这样对于多媒体处理有好处。POWER6最高端的Power 595是什么架构呢?POWER6 595最多达到64核,主频是4.2G和5G,它的内存可以装4T,它的I/O可以装大概600张卡,可以装600个PCI的插卡,这是非常高端的服务器。除了这个相对于POWER5+的595又增加了很多高可靠性方面,它可以有双时钟,它的CPU加节点的时候可以在线的加,增加了很多高可靠性的功能。时间功能不详细讲了。

  (图)大概的外观是这样的,上面是电源部分,在它的下面是中央处理单元,共有8个CPU节点,每8个里面有8个核,共有64个核,下面是放I/O抽屉的地方,如果I/O抽屉不够可以加机柜,放更多的I/O插口。它有双系统、双控制器,双时钟、双节点控制器、双光路诊断机构,可以看到这个机器到底哪里有潜在故障都可以直观的看到。(图)这是一个大概的结构。在一个比手掌还小的地方封装了两核的芯片和两个三级cache,相当于三个Chip,它的复杂度有八亿九千多个晶体管在里面。

  我们再看看它的中央处理单元,一个最基本的背板,背板上下各可以加四个节点,这样满配构成了64核的机器。它的构成是每8核和其他的8核形成非常复杂的网状结构,而不像其他的机器是简单的SMT,它是任意的点对点的连接,它和外界的连接是低延时、复杂的系统,这个架构可以做到利用少量的CPU完成复杂的任务。为什么IBM的机器配2C、16C、32C、64C就可以跑很好的性能,可能其他友商的机器需要配两倍CPU才能达到同样的性能,当然IBM的CPU有独到的地方,但是和友商的机器有很大不同就是平衡设计和高带宽上IBM做的比较先进。

  (图)这是和前一代POWER5的机器相比的情况。我们再看看中档机器POWER6的570,它是16核的机器,有4个节点的构成,具体的细节不介绍了,它支持什么样的磁盘技术、支持什么样的CPI插卡技术,它有内置的IVE的网卡,一个网卡可以是百兆、千兆甚至万兆,一个网卡可以顶16个网卡使用,你需要更多的网卡的情况,不一定真正的配16个网卡,可以利用集成的虚拟网卡代替。

  POWER6的570大概是这样的结构,(图)从4C加到8C,再加一个节点,加到12C的时候再加一个节点,加到16C的时候加四个节点,节点之间的连接是通过光纤总线连接起来,它等于把内置的连接线摆在外面,这样给用户带来的好处是可以在线加节点或者减节点,现在买了8C在跑业务,再加上第三个四核机器的时候可以把连线连起来就可以继续跑了。如果其中一个节点有问题,可以撤出来,剩下的节点继续跑,这样就满足了高可靠性的要求。

  IBM的机器是平衡的设计,那么平衡在哪里呢?我们看POWER5的570 4.7G的和POWER6 595,5.0G的主频机器比较,570每一个核到L1 cache是75.2GB,如果提升到5G的时候每一个核是80GB,到L2是150.4,提升到5G的时候会涨大160,到L3的时候16个核的情况下是300GB,64核是2560G。570是256GB/s,595是1366GB/s,I/O的带宽是62.7提升到640GB/s,主频的提升,从CPU cache到I/O都会随之匹配,这样如果一个重的应用会充分利用CPU,充分用到机器的机构,这就是一个平衡的设计。而不仅仅是有了6G主频,就把6G主频插在这儿,底下的总线根本不动,底下的总线不动,只插主频,那这个系统就是很糟糕的状态,因为很多I/O是空转的,整体性能会得到很差的效果。550是8核的机器,可以是落地式也可以是机架式,是中低端架构机器。

  POWER 550和前一代POWER5相比,它的内存带宽相对于前一代的绿颜色的数值从40几提升到140多,I/O带宽的从10提升到十几的样子,性能大概提升了50%、60%的性能。520是可以从1核、2核、3核、4核的结构,和前一代相比,性能提升了40%-50%。

  刀片服务器。POWER6的刀片服务器推出了JS12和JS22,就是从单核到四核的结构,如果大家感兴趣在第三个题目会听到。我们现在谈计算机,不知道大家从哪几个方面关注计算机。我个人经验来讲,关注计算机本身的硬件技术,要关注它的操作系统匹配情况怎么样,还要关注现在谈的绿色能源,是不是能力用少量消耗的能量带来很高的性能。因为现在很多用户已经从历史上走到今天,大家都有很多的共识,不再是上一个业务买一个机器了,这样买下来,机器的利用率非常低。加一个机器平均一个星期、一个月或者一年,利用率是在20%到40%,很多时候CPU都是很低,只有在有限的时间CPU的利用率达到50%-60%以上的,很多情况利用率是20%。很多情况是闲置状态,怎么办呢?大家买的是服务器,能够做服务器整合,买这些机器尽量在上面多跑几个操作系统、几个业务,让多个操作系统、多个逻辑机器共享整台机器的处理性能,让整台机器的处理性能得到提高。这样不让整台机器的硬件有闲置,就是做逻辑分区或者整合。

  下面会讲到虚拟化技术发展到今天我们已经走到了PowerVM。在70年代的时候IBM的大型机的主机就实现了虚拟化,IBM把三四十年的技术下载到开放平台上。可以让机器的使用率得到非常精细的使用。

  (图)这张图展示的是,大家购买机器的时候,是买最高峰时候的CPU利用率,平均来看利用率是在20%左右,你买这个机器是为了让高峰的时候可以很好地处理,可能多买了几个CPU,这一多买,可能就浪费,有的人可能为了三年以后、五年以后的增长再加30%的冗余,买的机器过大,但是利用率偏低,我们利用虚拟化技术,在一个大机器上开很多分区,这一个分区就是一个真实的操作系统,就是跑的一个业务,是应用服务器还是web服务器无所谓,你想做什么就做。我原来买五台机器现在买一台机器分五个分区,这五个分区对于整台机器的CPU可以做到非常协调的使用,能够保证整台机器的利用率达到很高的状态,同时减少原来购买CPU累计的数量,做整合以后可能会减少。这就是虚拟化技术带来的好处。

  (图)同时还可以做虚拟网卡,每个数据库、每个应用或者web应用不一定需要真实网卡,你可以通过虚拟化技术,通过共享的方式使用这些网络资源,能够降低购买网卡的数量。同时每台机器里面需要装操作系统的磁盘、装应用代码的磁盘,装日志的磁盘不一定配真实的磁盘,可以把外界的盘或者内部的真实磁盘划成一块一块的逻辑空间,把逻辑空间映射给不同的分区,这样就可以减少购买真实硬盘,买磁盘控制卡的数量。不但能够做CPU的虚拟化、内存虚拟化,还可以做到I/O的虚拟化。POWER6在今天还可以做动态分区迁移,如果这台机器负载很重,可以把其中一个分区在线迁到另外一台机器上。我们发了指令以后,在交易进行过程中就可以做到迁移。后面会详细解释这种技术。

  今天PowerVM的技术分成Express版、标准版和企业版,不同的版本支持的实现技术的版本可能有不同的组合。刚才简单谈到了虚拟化简单的概要。在高可靠性、可用性方面,IBM的机器也有非常独到的特点,这张表上用到了很好的特点。

  随着POWER6的推出,能够做到每个核,如果发现指令,算着算着有错误,会让它重算。大概的原理是这样的,在每一个周期的时候要检查现在处理器的状态,如果发现都很好,没有ECC和检查报错,就接着往下走,如果有会让上一个指令再算一遍,这些对于用户和应用都是透明的,保证应用程序能够畅通的执行下去。

  现在的计算机的技术五花八门,IBM又是POWER5、POWER6、POWER7,其他的厂商同样也有不同结构的东西,平时来面对一个用户讲,怎么选机器,到底什么样的机器符合我们的业务,这就涉及到对服务器选型的很困惑的考虑。有时候有些用户说再买8C就可以了,因为做这种考核是要花一定时间的。为什么呢?因为衡量机器又要看机器的处理性能,在工业界有很多的指标都是考查性能的,比如说有TPC-C看数据库性能,SPEC是看CPU,LINPACK是看高性能运算整个处理能力的,还有很多应用厂商开发的基准测试比如说SAP、甲骨文的、流体计算的。还有用户自己开发应用程序,可能需要用这个应用程序跑一下,看看这个机器跑多快,这些五花八门的指标衡量机器什么样的部位呢?并不是每个指标都是对整台机器的衡量。如果我们今天买的是一台数据库机器,是一个应用服务器的机器,你能够利用整型、浮点能力进行衡量吗?如果用这种衡量,因为这样的测试仅仅衡量CPU的cache部分,CPU跟I/O部分,CPU跟内存部分,CPU版跟CPU版之间的部分没有衡量到,因为这样的程序就几K、十几K的代码和长度一下加载到CPU里面运算,再也不用访问内存了,如果我们要用SPEC ATB2004或者是NoteBench应用,或者是邮件的应用,或者是TBCS仅仅衡量了CPU的cache和CPU的I/O,涉及一部分内存的衡量,不是全面的衡量。全面的衡量是系统级的基准测试,如果现在买的是一个系统,就尽量用系统级的,比如说TPC-C,是对整台的压力都能够压上去,对于CPU、I/O到网络,进行整体的加压。

  POWER6上市以后对于JAVA的性能、对于浮点和整型的性能都有很好的表现,大概是其他友商两三倍的性能,配这样的CPU,其他友商要配两三倍以上的CPU才能达到同样的处理能力。

  内存带宽。它编写了一些程序,让多个CPU工作,让它拼命从内存中读数据,进行处理,看看它完成的结果。595,考虑它的结果是805000,平均一个CPU大概是12000,前一代的POWER5+平均一个CPU是3000,SUN最高端的E25K,平均一个CPU访问内存密集型的应用是528,HP最高端的安腾架构的1.6G的128核的,平均一个核是1300多,这说明从CPU到内存的通道的速度,POWER6的机器设计的是非常畅通无阻的,所以跑复杂交易的情况下可以跑出很好的性能一点不奇怪,你要让它到高速公路上跑,不要让它到稻田里跑,就是尽量把I/O匹配一个好的磁盘,不要瓶颈都在I/O上,你的磁盘如果优化的好,这样的机器一定可以充分利用起来,因为它的内置结构是比较畅通的。

  TPC-C是衡量整台机器性能的。这些性能都是上网可以查到的,TPC-C是第三方的非营利组织。IBM公布的TPC-C,跑的规则是TPC-C规定的,最后我们提交几百页的报告,提交给TPC-C委员会,它贴在网上,全球质疑半年,如果没有造假可以通过。TPC-C都是在美国测出来的,在各公司总部测的,谁也不敢拿商业信誉做赌注的。TPC-C是各硬件厂商测出来的,如果这个机器一般都是不公布的。一般来讲推出了机器以后,它的TPC-C值会很快推出来,TPC-C网站上公布最多的两家公司是IBM和HP,HP公布的TPC-C值比IBM多得多,TPC-C是几大厂商公认的。

  POWER570,它16核跑一个TPC-C,是跑了161万,平均一个核跑10万。POWER5+时代平均一个核能跑5万到6万的样子,其他友商公布的TPC-C值是128核的高档机器,也是409万,POWER6平均一个核是10万,其他厂商的CPU,平均一个核是3万。看TPC-C一定要比较同样架构的,不能8C的机器和128C的机器比。如果这个机器扩展到64C、128C,CPU之间的连接、内存之间的连接,板和板的连接就是很大的影响,我们比TPC-C要看机器的型号,应该从实测的最高端的值推测它半K的东西,也不能用小型号机器推大型号的机器。

  POWER6里面还测了SAP两层应用,SAP里面有一个模块是销售分发,一台服务器既跑应用服务器,又跑数据库服务器,在座有些朋友你们的应用,有些确实把应用和数据库跑在一台机器上。POWER6的595测了SAP的销售分发模块,它的测试值是能够带35000个并发用户,其他厂商128个CPU带3万个,POWER6利用64个核带35000个。平均每个核带234,POWER6平均每个核带553个并发用户。它的整型处理能力同样可以做到这样。

  我们看看SPECjbb的应用,POWER6一个核相当于其他厂商三个核的性能。有些机器处理能力比较强,可能不是一下子就买了满配的机器,买了半配,买了四分之一的机器,这时候只有最高端的TPC,怎么推少数量的PC呢?这时候实测的主频和实际个数除,再乘上希望买的CPU个数和希望买的主频,这样就可以推出来,你实际买的机器大概处理能力是多大。所有厂商的机器多按照这样的公式来推,很多客户买机器的时候认为是比较公平合理的。一定要用实配的最高端数量乘实际购买核的数量。

  我们再看看AIX操作系统。光有一台机器,有了硬件,如果操作系统不好,整个处理能力一样不好。我们曾经做过实际测试,和友商的机器放在一个机房里跑测试,发现不同的操作系统也带来了12%-13%的影响,同样都是Unix但是不同的调度策略是不一样的,CPU调度策略是否优化对于整个机器有很大的影响。AIX操作系统已经有20年的历史,1986年问世,发展到现在是AIX6,它相对AIX5,虚拟化上增加了很多功能,比如说在一个操作系统可以做很多的分区,一个操作系统可以分为1000多个分区,可以做分区的在线迁移。安全方面,是什么人安全作业,就授予他什么样的角色,不一定把全部口令都放开,你管备份的,只要具有这个角色,就可以做备份的所有任务,以前需要把安全口令告诉给开发人员,告诉做系统备份的人员,甚至有人要创建什么也要告诉他一个口令,这是很不安全的。文件系统是加密的,如果你把备份袋或者东西搞丢了,别人搞到了,他也读不懂文件系统的内容,文件系统是加密的。AIX的操作系统有一个Security Expert安全专家来做,然后在线的打补丁,在线的内存保护技术,让应用程序不会把不归你管的程序轻易改掉。应用程序,你有可能只有读系统的权限,你改不了重要区域的东西,这在高可用上有很多的加强。

  AIX6出来了以后,IBM的Power Systems产品部负责人,他给用户一封信说以前AIX5.1、5.2、5.3可以二进制的跑到AIX6上来,你不用做应用的迁移。同时IBM在AIX5.306以后每出一个补丁,从它问世往后,实验室的工程师给予免费支持两年,然后可以走向下一步TL,每一个TL出来都会有两年的实验室的支持,这是对用户一个最大的承诺,因为除了要做更新的操作系统之外还要留下相当一部分的维护购买的版本,以前就是建议升级,现在你买了这个版本要是5.306从问世那一天追加两年都有人给以维护,这是最大的工作量,(图)这张是认证,操作系统的可靠性是怎么样,安全性怎么样,现在业绩有最高级别的是EAL4+,你们可以看看其他厂商你们做了没有。EAL4+这是美国的标准,以前我们用欧洲的标准,现在都用EL的标准,EAL4+相当于以前操作系统B1的安全级别。操作系统都拿到了EAL4+,逻辑分区和机器这些东西都拿到EL4+。这样一个认证,可以告诉大家你们可以放心的使用这样的操作系统,这样的操作系统相对于其他的操作系统更安全。

  (图)这是一家咨询公司对于几种操作系统进行了评估,AIX操作系统是被认为最稳定的操作系统。现在综合指标来看SUSE的可靠性比windows还要好。

  关于绿色能源。大家可能说你这个机器处理能力这么强,主频这么强,耗电怎么样呢?现在很多面临着机房不够了,我要增加机器,保障奥运,但是机房没有地了,这些小机器散热是一个问题,成本很高,很多大的数据中心都面临着这样的问题,国内是这样,国外的压力更大。那么怎么节能减排、降低能耗,采用先进的技术,改造机房。在数据中心里要查最耗电的设备是不是IT,还是哪些UPC,还是哪些控制湿度的设备,还是供风设备,现在很多机房发现IT设备不是最耗电的,反而是通风设备吃了很多电,甚至对地板下的通风的管理,有时候送风口根本吹不到机器上,这也是很大的问题。

  现在从服务器上看,要看是不是电源和内存、主板、硬盘不用的时候是否同样耗电呢,能不能让机器更有效的使用能耗呢。每台机器的利用率是80%还是20%,如果是20%的贡献,能不能减少机器的数量,提高利用率,这也是降低能耗的重要途径。针对每一台机器来讲,在POWER6里面有很多的节能减排措施。比如说你可以通过管理软件监控它实际上的能耗使用,额定功率是500W,实际监测380W就够了,你可以把更多的能源分配给别的机器,并不预留这么多,能耗、电源、热能都能够监控,在有些CPU不在使用的时候就关掉它的电路,等使用的时候马上供电,这些都可以减少机器的能耗。内存也是一样的,有的用户买了16G内存、64G内存、128G内存,内存使用率有时候不高,内存不使用的时候我们是否也供电呢,POWER6的机器发现不用的时候就停止供电,利用的时候就可以供电,这样性能就很好地的节能减排。还有那些I/O插槽,插槽空或者插卡时是不是都供电呢,POWER6也做了优化,都是利用的时候才供电,甚至可以把主频从5G降到3.8G等等一系列措施,我们看到一台机器平均每瓦能带来多少性能,看POWER 570,它的耗电是5.6KW,POWER5的570的耗电是5.2KW,但P5的性能是85,而P6是134,POWER6的功耗相对前面没有大的提升,可以认为是相等,但是带来了性能的提升,每功耗带来的性能得到了很大提升。

  在绿色这块实施上有很多的技术,有虚拟化技术,可以选节能减排比较好的服务器,再加上机房的配合,几方面的配合可以降低整个机器的耗能。