大热背后?探索DPU如何开启计算新时代

作者:贾桂鹏 来源:原创 2022-10-18

  当下,随着人工智能、机器学习已经成为企业级应用方案的主流趋势,各企业需要在任何位置都有足够的处理能力,这对传统的数据中心基础设施带来全新挑战与巨大冲击,需要构建现代数据中心来支撑企业业务应用。

  NVIDIA CEO黄仁勋曾多次提到过CPU发展逐渐放缓,摩尔定律似乎已经失效,以前老的DIY从业者会感受到CPU每一代性能、晶体管数量日新月异,新一代比上代有高一倍以上的性能。但现在新的CPU,不管是消费级还是企业级高出30%-40%已经算非常高的一个成绩了。

  因此,我们发现为了满足企业日益增加的计算需求,继CPU、GPU之后,DPU成为了数据中心场景中的第三颗重要的算力芯片,为高带宽、低延迟、数据密集的计算场景提供计算引擎。数据中心内3U共存已经成为一种不可逆转的趋势了。

  Project Monterey平台的价值

  NVIDIA网络市场总监孟庆表示:“黄仁勋先生多次在演讲中表示数据中心正在演化为一个AI工厂。很多调用AI接口的APP打开几秒就关闭,这样每一次激活APP诞生多个容器,瞬间打开关闭对数据中心和后台就是一个个突发的小峰值。这对数据中心来说都是前所未有的挑战,而在里面负责网络流量的,不管是交换机、智能网卡,也面临很大的负荷。”

大热背后?探索DPU如何开启计算新时代

NVIDIA网络市场总监孟庆

  伴随数字经济时代的到来,也为数据中心带来了巨大挑战,NVIDAI认为挑战主要体现在四方面:

  一、主要是由于人工智能、科学计算、应用复杂工作负载,使得现代应用程序持续产生和处理大量的数据,这对数据中心的性能和数据的处理能力提出了巨大的挑战。

  二、过去一个程序是单一的方式在数据中心服务器当中运行,现在很多应用程序变成了分布式微服务方式给客户提供相应的服务,它的部署并不是运行在数据中心中的某一台服务器,会运行在多台服务器上,甚至分布在不同的物理位置的微服务给客户提供应用,所以,需求不断在增加。

  像微信、扫码等应用都会有大量的需求产生,不仅包括在普通的数据中心当中,在网络边缘和多云架构里也是非常普遍的现象。这对数据中心基础设施运营也会有比较大的挑战。

  三、CPU受摩尔定律发展的限制,性能提升放缓。由于CPU要管理基础设施相关服务和操作,所以会消耗CPU的内核和相应的资源。本来CPU应该拿更多的资源服务于客户的应用,但由于基础设施消耗有一部分CPU要忙于基础设施的操作。

  四、东西向流量不断增加,安全攻击面成为威胁。东西向流量,主要是很多应用程序会由分布在数据中心甚至不同物理位置上的微服务程序提供,他们之间就会产生相应的数据流的数据交互。由于相互之间的流量增多,就会导致存在跨服务器或者数据中心内部的横向攻击和一些威胁,甚至有的客户会把一个网络上的应用程序下载到数据中心里应用,这些都会有潜在的安全风险带入到数据中心中,如果安全策略或者安全方式模型不能有效地抵御这种攻击会造成比较大的威胁和相应的损失。

大热背后?探索DPU如何开启计算新时代

  面对数据中心的挑战,在VMware Explore大会上NVIDIA、VMware和戴尔联合发布Project Monterey的平台。

  据了解,Project Monterey将vSphere 8企业工作负载平台和NVIDIA BlueField DPU进行结合,在戴尔Power Edge服务器或VxRail超融合架构一体机上运行,这样就可以有效地把DPU、GPU和NVIDIA Enterprise AI软件针对vSphere 8做负载优化,在运行一些AI软件时,也可以把vSphere 8的功能,卸载、加速和隔离到NVIDIA BlueField DPU,这就是Project Monterey为未来的AI和现代应用程序工作负载重新构建一个现代的数据中心。

  NVIDIA网络技术专家崔岩介绍道:“当采用NVIDIA BlueField DPU后,CPU可以零介入基础设施部分。这里主要和vSphere配合的是有软件定义的安全、软件定义的网络和整体性能加速的部分,将给上层应用提供更好的基础设施的支撑。CPU资源会更好地支撑客户业务应用,有更多支持虚机和容器的能力,这是整个NVIDIA BlueField DPU的作用。”

大热背后?探索DPU如何开启计算新时代

NVIDIA网络技术专家崔岩介

  我们可以看到,基于NVIDIA BlueField DPU实现如下三大方面的功能:简化基础设施和工作负载管理;提高基础设施运行效率;借助零信任安全模式加强基础设施安全性。

  比如,在VMware体系上运行NGINX Web服务器的应用,如果在传统标准智能网卡和CPU介入的方式下,需要有8个CPU内核管理跟运营基础设施的相关操作。当采用了DPU之后,这8个内核完全被释放,不需要CPU的任何介入,DPU就会把这些基础设施管理相关的加速能力直接体现出来。

  从我们的理解来看,Project Monterey的最终愿景是,构建一个可以解耦的IT基础架构,不管是CPU、GPU和FPGA,Project Monterey可以去解构,帮助用户从不同的物理服务器上去调取他所需要的内存和更多计算资源。

  感兴趣的用户可以通过NVIDIA的LaunchPad申请试用,并可以亲自动手,探究vSphere 8如何在NVIDIA BlueField DPU上运行能够获得更好的性能和能力体验。

  DPU黑客松再来临

  为了更多推广DPU的发展,继第一届DPU中国虚拟黑客松竞赛在2022年4月16日至17日圆满收官后,NVIDIA将于2022年10月22日至23日发起并主办2022秋季DPU中国虚拟黑客松竞赛。

大热背后?探索DPU如何开启计算新时代

  本次竞赛旨在帮助开发者通过NVIDIA DOCA软件框架构建创新的RDMA加速存储与AI应用程序,基于NVIDIA BlueField DPU与NVIDIA InfiniBand网络实现存储、AI卸载、加速和隔离功能,引领新一代人工智能就绪的基础设施,驱动未来AI工厂。

  NVIDIA 网络技术专家崔岩介绍道:“在黑客松比赛的开发环境上都会采用最新的DOCA版本,能够让参加比赛的开发者体验和使用最新的DOCA功能,”

  和上届一样,此次黑客松仍然会有开幕式和训练营活动,之后会进入到24小时的比赛环节,比赛中各个团队将投入到创新应用的开发之中,到第二天10月23日上午,是每个团队现场比赛的演示,他们将对自己做的课题做一个整体展示,后面会有中国的本地评委和国际评委对他们的比赛结果进行评分,最终比赛结果将于24日周一公布。

  写在最后

  随着AI逐渐渗透到更多行业,许多企业技术公司试图将AI技术引入IT管理软件,来帮助客户更高效地工作。我们发现,NVIDIA希望通过赋能的方式,将更多的技术能力带给企业和开发者,让更多人享受到科技的红利,而不是将自己局限于产品解决方案供应商这一身份。

发布
X
第三方账号登录
  • 微博认证登录
  • QQ账号登录
  • 微信账号登录

企业俱乐部