为AI运算优化 NVIDIA全新Tesla计算卡性能提40倍

2016-09-14 13:37:00 作者:比特网 分类 : 比特网

  2016 年 9 月 13 日,NVIDIA宣布旗下基于 Pascal架构的深度学习平台再添新成员:新款 NVIDIA Tesla P4 和 P40 GPU 加速器及新软件带来大幅飙升的效率和速度,能更快速地处理人工智能服务的推理工作负载。

P40

  NVIDIA联合创始人、总裁兼首席执行官黄仁勋先生向大家介绍新款Tesla P4和P40加速器

  语音激活的帮助、垃圾邮件过滤器以及电影和产品推荐引擎等现代 AI 服务正迅速变得更复杂,需要的计算能力比一年前的神经网络最高高出 10 倍。目前基于 CPU 的技术无法提供现代 AI 服务所需的实时响应能力,导致用户体验较差。

  Tesla P4 和 P40 专门设计为执行推理,也即使用经过训练的深度神经网络来识别语音、图像或文字,以响应用户和设备的查询。这两款 GPU 基于 Pascal 架构,包含基于 8 位 (INT8) 数据的专用推理指令,响应速度比 CPU 快 45 倍,并且比发布尚不满一年的 GPU 解决方案快 4 倍。

  Tesla P4 为超大规模数据中心提供极高的能效。它外形小巧,能装入大多数服务器中,而且功耗极低(初始功率只有 50 瓦特),能效与处理推理工作负载的 CPU 相比提高 40 倍。对于视频推理工作负载,一台配备单个 Tesla P4 的服务器可以取代 13 台 CPU 服务器,而且总体拥有成本(包括服务器成本和电力成本)可节省超过 800%。

  Tesla P40 提供非常高的深度学习工作负载处理能力。它包含的 INT8 指令带来 47 万亿次运算/秒 (TOPS) 的推理性能,使得一台配备八个 Tesla P40 加速器的服务器在性能上可以取代超过 140 台 CPU 服务器。(3)按每台服务器的成本大约 5,000 美元计算,仅服务器购置成本就能节省超过 65 万美元。

  NVIDIA 加速计算事业部总经理 Ian Buck 说道:“凭借 Tesla P100 以及今天推出的 Tesla P4 和 P40,NVIDIA 为数据中心带来了极其罕见的端到端深度学习平台,让各行各业都能淋漓尽致地发挥 AI 的巨大潜能。它们使训练时间从几天缩短到几小时,让用户能立即洞察玄机,还能实时响应消费者的询问,向他们提供意见或建议。”

  能加快推理速度的软件工具

  两款创新的软件助力 Tesla P4 和 P40,显著加快 AI 推理速度,它们就是:NVIDIA TensorRT 和 NVIDIA DeepStream SDK。

  TensorRT 是为优化将部署到生产环境的深度学习模型而创建的库,能即时响应极其复杂的网络。它通常以 32 位或 16 位数据的形式获取接受训练的神经网络,并针对降低了精度的 INT8 操作优化这些网络,从而最大程度地提高深度学习应用程序的处理能力和效率。

  NVIDIA DeepStream SDK 利用 Pascal 服务器的强大功能同时对最多达 93 路的高清视频流进行实时解码和分析,相比之下,双 CPU 服务器只能对 7 路视频流这样做。这解决了 AI 领域的一大挑战:在自动驾驶汽车、交互式机器人、过滤和广告投放等应用场合下,理解大批量的视频内容。通过将深度学习能力集成到视频应用程序中,公司能够提供以前不可能提供的创新型智能视频服务。

  让客户的服务水平实现飞跃

  如今,NVIDIA 客户提供越来越新颖的 AI 服务,这些服务需要极高的计算性能。

  百度高级研究人员 Greg Diamos 说道:“向每个用户提供简单和快速响应的体验对我们很重要。我们在生产环境中部署了 NVIDIA GPU,提供由 AI 驱动的服务,例如我们的 Deep Speech 2 系统。通过使用 GPU,响应速度达到了未经加速的服务器不可企及的水平。具备 INT8 功能的 Pascal 将实现更大的飞跃,我们期待它能给用户带来更好的体验。”

  规格

  以下是 Tesla P4 和 P40 GPU 的规格:

* 本文为ChinaByte比特网原创内容,版权所有,转载请注明出处和原文链接,未经授权请勿用于商业用途。

芥末视频

最近更新
科普

科普图集
带着朋友和机器人上月亮散步

带着朋友和机器人上月亮散步>>详情

邮件订阅

软件信息化周刊
比特软件信息化周刊提供以数据库、操作系统和管理软件为重点的全面软件信息化产业热点、应用方案推荐、实用技巧分享等。以最新的软件资讯,最新的软件技巧,最新的软件与服务业内动态来为IT用户找到软捷径。
商务办公周刊
比特商务周刊是一个及行业资讯、深度分析、企业导购等为一体的综合性周刊。其中,与中国计量科学研究院合力打造的比特实验室可以为商业用户提供最权威的采购指南。是企业用户不可缺少的智选周刊!
网络周刊
比特网络周刊向企业网管员以及网络技术和产品使用者提供关于网络产业动态、技术热点、组网、建网、网络管理、网络运维等最新技术和实用技巧,帮助网管答疑解惑,成为网管好帮手。
服务器周刊
比特服务器周刊作为比特网的重点频道之一,主要关注x86服务器,RISC架构服务器以及高性能计算机行业的产品及发展动态。通过最独到的编辑观点和业界动态分析,让您第一时间了解服务器行业的趋势。
存储周刊
比特存储周刊长期以来,为读者提供企业存储领域高质量的原创内容,及时、全面的资讯、技术、方案以及案例文章,力求成为业界领先的存储媒体。比特存储周刊始终致力于用户的企业信息化建设、存储业务、数据保护与容灾构建以及数据管理部署等方面服务。
安全周刊
比特安全周刊通过专业的信息安全内容建设,为企业级用户打造最具商业价值的信息沟通平台,并为安全厂商提供多层面、多维度的媒体宣传手段。与其他同类网站信息安全内容相比,比特安全周刊运作模式更加独立,对信息安全界的动态新闻更新更快。
新闻中心热点推荐
新闻中心以独特视角精选一周内最具影响力的行业重大事件或圈内精彩故事,为企业级用户打造重点突出,可读性强,商业价值高的信息共享平台;同时为互联网、IT业界及通信厂商提供一条精准快捷,渗透力强,覆盖面广的媒体传播途径。
云计算周刊
比特云计算周刊关注云计算产业热点技术应用与趋势发展,全方位报道云计算领域最新动态。为用户与企业架设起沟通交流平台。包括IaaS、PaaS、SaaS各种不同的服务类型以及相关的安全与管理内容介绍。
CIO俱乐部周刊
比特CIO俱乐部周刊以大量高端CIO沙龙或专题研讨会以及对明星CIO的深入采访为依托,汇聚中国500强CIO的集体智慧。旨为中国杰出的CIO提供一个良好的互融互通 、促进交流的平台,并持续提供丰富的资讯和服务,探讨信息化建设,推动中国信息化发展引领CIO未来职业发展。
IT专家网
IT专家新闻邮件长期以来,以定向、分众、整合的商业模式,为企业IT专业人士以及IT系统采购决策者提供高质量的原创内容,包括IT新闻、评论、专家答疑、技巧和白皮书。此外,IT专家网还为读者提供包括咨询、社区、论坛、线下会议、读者沙龙等多种服务。
X周刊
X周刊是一份IT人的技术娱乐周刊,给用户实时传递I最新T资讯、IT段子、技术技巧、畅销书籍,同时用户还能参与我们推荐的互动游戏,给广大的IT技术人士忙碌工作之余带来轻松休闲一刻。