比特网(Chinabyte)11月6日综述(王允)  四个月前见到顾凡,身为英特尔中国有限公司服务器事业部产品经理的他向我们展示了一个有关高性能计算发展的蓝图:将高性能计算从实验室中解放出来,应用到更加广泛的商业计算中去;将高性能计算从金字塔尖上解救出来,进入到更加广阔的中低端应用中;将高性能计算摆脱高能耗的“恶名”,走进绿色计算。也许在当时他的眼中,全球超级计算机Top500中73.5%的系统占有率并不能说明高性能计算从此就更加亲民了。

  当时的顾凡几乎已经把英特尔在高性能计算领域的优势以及技术要点介绍清楚,但是,当应用深入的时候,高性能计算的问题还是层出不穷地出现在了记者们的面前。他当即表示,将会邀请专家为记者解答疑问。

  不难想象他对高性能计算领域的重视,在英特尔全球CPU出货量中,有20%被用作高性能计算,对于细分市场来说,这是相当大的一部分业务。而且,在新鲜出炉的中国高性能计算Top100榜单中,以英特尔处理器为核心的系统占有率达到了71%,前十名中有九套系统采用了英特尔处理器,英特尔在中国高性能计算市场占了大半壁江山。

  在无锡2008年高性能计算学术年会后的专访中,顾凡向我们介绍了两位来自英特尔高性能计算领域的带头人——Sanjay Goil博士以及Tom Metzger先生。两位更加专注技术的先生给在场的记者们从另一个层面解释了英特尔在为高性能计算做的事情。

  坚信多核化趋势、相信软件动力

  Tom Metzger先生在英特尔工作了17年,这位高性能计算机解决方案设计师主要负责帮助客户找到针对其计算环境的解决方案,也还领导着大量全球计算资源的升级和管理工作。在漫长的面对高性能计算的工作中,他和他的团队找到了解决高性能计算目前面临问题的办法,也看到了英特尔对于“多核”的信心。

英特尔:提升高性能计算中的软件动力
英特尔高性能计算机解决方案设计师Tom Metzger先生(比特网配图)

  他介绍说,英特尔从硬件架构到chip层面还有基础设施三个层面上都在做技术驱动,所有的工作核心是摩尔定律,包括如何使用摩尔定律,如何使用工厂的能力,保证在芯片的层面有最佳的能效比。

  在解释服务器层面时,他用英特尔的新架构Nehalem来说明问题,“Nehalem有新的技术出现,能够在服务器平台层面对服务器能耗做出智能化的管理。需要多少的能耗,用户自己去管理。”他补充说,无论是芯片组还是服务器这个层面,都应该实现这样一种状况,一些不繁忙的处理器内核省下来去帮助另外一些内核的使用率提升。

  当然,对于行业的发展来说,单靠英特尔的努力是远远不够的。Tom Metzger先生表示,从基础架构来说,要和产业链一起推进这个行业的发展,要和一些国际驱动的绿色计算的组织去合作,让产业链中的每一个角色都往绿色节能上去靠。

  英特尔对于多核的信任是显而易见的,这个公司的上下都认为多核是未来的趋势。Tom Metzger先生重申了这个观点,在谈及这个问题时,他笑了一下说,:“总之,多核并行是必经之路。”

  Sanjay Goil博士是英特尔公司高性能计算软件经理,在他的观点中,软件一定是将高性能计算能力完全迸发的好伙伴。他解释说,从软件角度来说,未来在超大规模系统中如何去扩展,今天所编写的高性能计算的代码能否在未来多核的平台上兼容性地去扩展,都是值得考量的。因为集群本身没有意义,意义在于利用集群本身去创造出更多的科研成果,让软件的迁移,扩展都变得更加简单,而且让今天的成果,可以扩展到未来的架构。这一切都将得益于软件的发展。

英特尔:提升高性能计算中的软件动力
英特尔公司高性能计算软件经理Sanjay Goil博士(比特网配图)

  英特尔(中国)有限公司亚太客户响应团队技术经理何万青博士再次针对英特尔对高性能计算软件优化方面做出的贡献进行了阐述。

  英特尔现在有专门的开发工具,并且是在已有的编程模式下开发出来的。万青博士以及他的团队会发布已经优化的MPI,同时提供多种接口的实现机制提供,可以更好地跟核绑定。英特尔同时也在和合作伙伴一起发布产品。

  他表示,我们现在需要并行的思维模式,但是思维模式很难改变,所以英特尔也在致力于如何让实现串行思维下的并行编程模式,因为并行开发的编程模式一方面适合硬件的发展,也能够满足易用性。

英特尔:提升高性能计算中的软件动力
英特尔(中国)有限公司亚太客户响应团队技术经理何万青博士(比特网配图)

  不难看出,其实三人在高性能计算技术发展趋势的观点上趋于一致,那就是简单性、保护投资、遵循标准。

  如何保证计算效率——优化

  能耗是一个很老的话题,其实有的用户并不关心能耗,他们注重的只是如何提高效率,针对这个问题,Tom Metzger先生表示,对于大规模集群的扩展来说能耗还是很重要,从效率的角度来说 效率越高可以用越少的节点来完成任务,但是能耗更多的是从处理器和服务器架构来谈,效率更多的是软件的问题,能效不要完全是看linkpak 这个效率完全代表不了实际应用中的情况,测试与应用是有差距的。

  出现这种情况的原因是大规模集群的出现,如何让厂商适应更多的大规模的应用,效率和能耗实际上是不一样。客户的规模越来越大,对需求解决的时间也会越来越长。在集群盛行的时代,分布式应用越来越广。比如今天很多HPC只能跑在512个内核上,而未来应该让商业应用计算程序可以跑在更多的处理器上,算法的优化就是其中一个。

      顾凡补充说,就个人而言,他认为算法的优化非常重要。高性能计算的普及化必须有足够的人才对并行编程足够了解。英特尔为此制定了一个计划,让英特尔的软件团队在全球各个大学开展并行编程的课程,中国目前排在全球第三的位置。另外,除了在人才培养的方面,英特尔还有一个Intel Cluster Ready计划(ICR),这个计划只有一个目的,就是让高性能计算普及如何解决高性能计算无数的硬件和软件甚至操作系统中间件这些插件之间的组合和兼容性,让客户做到一站式采购,简化HPC系统和软件的部署。对于英特尔来说,这个计划最大的价值就是让全球的编程工作者都站在同一个起跑线上。

      他还向比特网(Chinabyte)透露说,戴尔是目前最大的采用ICR的硬件厂商, ICR与他们的"HPC Simplify(HPC 简单化)" 策略一致,刚刚发布的Cray CX1 个人HPC 系统也获得了ICR的认证。顾凡表示,英特尔为这个计划投入了很多的人力和软件资源。同时,中国将是继美国和欧洲市场之后ICR计划最重要的拓展市场,国内的很多家OEM厂商已经提出要加入ICR计划, 目前正在进行过程中。未来对于国内重要的行业HPC应用比如石化行业,英特尔中国的软件团队会帮助他们加入到ICR中并得到认证。

  英特尔:未来会异构,但是编程模式不变

  在本次会议上,“异构”成为了一个备受关注的话题。针对此问题,Tom Metzger先生表示,英特尔也会做异构的内核,但是最大的不同在于,虽然是异构的core,但是对于英特尔来说,会将编程模式归于统一。也就是说,编程模式对于两种不同的core是一样的。

  如果是不同的处理器混合一个集群的话,可以从一个集群上扩展到另外一个集群上。Sanjay Goil博士补充说,随着many core产品的发布,编程模式不同的问题会一起解决,这样产品性能会提高,效能也会提高。

  他还表示说,英特尔要把主力放在主流的市场上,因为现在集群架构和定制化系统的差距越来越小。

  有关PHPC的问题也成为专访中的一个小高潮,因为此前英特尔还从未就这种个人高性能计算的机器发表过意见。Tom Metzger先生表示,英特尔非常坚信这个市场的存在,也很看重这个市场。

  顾凡接下来补充说,这个市场一定会发生。惯于举例的他此时依然发挥了特长。他说,其实在CPU占有率上,PC是第一,笔记本是第二。工作站和高性能计算 都是用于创新和设计的聚集的地方,随着国家鼓励自主创新,这种市场一定会发展。但是在一些小的集群上,用户更关注产出,希望利用高性能计算的工具来完成自己的目的,他们要比大的客户更关注产出productivity。

  另外,对于个人计算机最大的挑战是要安静,同时还要让用户用得起这样的产品。而many core恰好是这个市场比较好的解决方案,软件的易编程性也是对个人计算机的一个很有力的补充,因为这种用户不像一些大型客户可以有专门的团队来进行软件编程或者优化,这个时候软件的易编程性就格外重要。

  万青博士称,国内很多高校的一些专业比如传热学等,都需要用到高性能计算,在同样的性价比上,PHPC可以不用改变编程模式,给高校降低了计算的复杂度。

  当然,这个新兴的市场绝对不是一家厂商就能完成的,它需要产业界的共同合作,而英特尔在这个市场里要做的,就是提供一个合理的架构,能够做到保护投资,保证性能。

  在硬件的背后,其实有着更多的软件在发挥动力帮助实现计算资源最大化,在英特尔的眼中,他们正在做的就是,硬件、软件——两手抓,两手都要硬。