初窥富士通PRIMEQUEST 1800E服务器
前言
很多年来在企业级主机领域,通常以CPU支持的指令级来做产品的分类。在这沿用了几十年的分类方法下,诞生了我们常说的使用RISC(精简指令处理器)小型机和使用CISC(复杂指令处理器)的PC服务器。前者包含了我们常见的所有Unix Server,而后者则是近十年来逐渐占据主导地位的x86 Server。
从整个行业发展的眼光来看,在全球范围内Unix Server由于其相对的封闭性、高昂的初期采购投入和运维费用,最近几年的市场占有率已经在快速的下滑。而随着Linux的普及,使用x86处理器的PC Server却在以每年几何级数的方式呈现出飞速增长的趋势。
对于企业的IT决策层来说,问题随之而来。由于Unix整体平台是久经考验的“战士”,因此要顺应潮流将其上的业务平滑迁移到PC Server上来说并不是一件简单的事情。虽然说目前绝大多数在Unix系统上的业务系统都可以迁移到Linux上,但是面对稳定性和可靠性完全不在一个数量级上的PC Server,有多少IT决策层有这个胆量拍板将核心业务进行这样的迁移。
可谓前有悬崖后有追兵,目前PC Server上使用的处理器,尤其是最新的Xeon E7系列处理器的性能正在向传统的RISC处理器发出了巨大的挑战,并且其实测性能也大幅超过了Intel自家的安腾II。面对这样一个窘境,其实目前绝大多数公司都在犹豫,都在彷徨。
是时候做出一些改变了,于是我们今天的主角登场:Fujitsu PRIMEQUEST 1800E服务器。从目前富士通的SIRIUS产品线上可以看出来(图slide/1), 
PQ 1800E服务器属于其以往高端Unix服务器的PRIMEQUEST系列,明显区别于以往x86服务器的PRIMERGY RX系列产品线。更特别的是同样使用8路Intel Xeon 7500系列处理器,RX900和PQ1800E却属于两个完全独立的产品系列。这又是为什么呢?

关键的关键就在于PQ1800E对于硬件分区的支持,当然也伴随着更强大的可扩展性。所谓硬件分区其实是一个在Unix Server上应用多年的成熟技术,而据笔者所知,PQ1800E是第一款将该技术应用在PC Server上的最终产品。
外观赏析
(暂略)
结构分析
可能很多人看了之前这些高清无码图之后,虽然发现了这台服务器很大,PCIE插槽、本地硬盘可扩展性很大,但是对于其硬件设计的特殊性也不知道所以然。那么就让我们看看这台服务器的透视结构图:
(图Slide/3)

这台服务器有几个核心部件组成:系统板(SB)、SAS单元(SASU)、I/O板(IOB)、千兆位LAN/SAS/PCI盒接口板(GSPB)和中间板(MP)。
(图Slide/4)

其特殊的硬件结构设计和硬件分区的实现,其实就体现在这里。
首先每一块系统板包含了最大两颗CPU和16个DIMM的内存插槽。因此x86 Server结构中核心的CPU/内存资源被硬件上划分为四块,并通过Intel的QPI总线连接到中间板上,这样就为将服务器硬件分成四个分区创造了基本条件。
当然对于需要安装操作系统的服务器来说,仅仅为CPU/内存创造出硬件分区的条件是远远不够的。其次需要关注的是本次存储子系统,好在PQ1800E的SAS单元也是和每个MB一一对应的关系。(图Slide/5)

每一块系统板都对应了一块阵列卡和4个2.5寸的SAS硬盘仓位。并且通过一根PCIE 4X的通道连接到GSPB上。
再次,针对I/O板和GSPB也可以将其一分为四,和服务器前端的系统板、SAS单元形成一一对应关系。(图Slide/6)

经过这样一番设计之后,就能实现如下功能:
(图Slide/7)

将一台PQ1800E服务器分为两个分区(注:当然三个和四个也是可以的),如果一个分区中的系统板出现硬件故障,预留的硬件分区硬件就可以快速的顶替已经损坏的硬件,并将服务器其他资源,如磁盘子系统、I/O板等资源迅速切换过来。经过一次重启之后服务器又可以像什么都没有发生过一样继续正常工作了。
而发生故障的系统板可以通过在BIOS中关闭相应的模块,来做到备件的热插拔替换。
而如果系统中没有别的多余的预留硬件分区,PQ1800E也可以通过将系统板降级使用来做到重启后自动修复系统。(图Slide/8)

下图所示的就是当多块系统板中有一块出现故障,该硬件分区会自动踢出该故障系统板;而在同一个系统板上出现某个CPU故障的时候,服务器可以自动踢出某个CPU,以保证最大限度的硬件可用性。



