论坛 产品库 视频 专题 CIO俱乐部 Windows8 实验室 CMO俱乐部 案例

英特尔白皮书:扩展全球最流行的处理器架构

发布时间:2007-11-15 13:35:00 来源:比特网 作者:英特尔
关键字:45纳米 CPU 处理器 服务器 评论 英特尔 综述

  前言

  通过不断为计算机架构添加新的功能,协助业内企业提供具有较强性能及丰富特性的高级应用,英特尔在创新方面的经验可谓源远流长。从最初的英特尔8086 处理器,到英特尔酷睿2 双核处理器中的追加 SIMD 流指令扩展 3(Supplemental SSE3)技术,英特尔始终领导着业内最流行、使用最广泛的计算机架构 — 英特尔架构的功能的不断扩展。秉承上一代产品的创新特性,英特尔架构的最新扩展将构成 SSE2 出现以来最具影响力的指令集,它表明英特尔在快速推出产品的道路中将实现又一次重大飞跃,未来数年,英特尔将提供具有强大性能、丰富功能,以及高能效特性的优异产品。

  这些新指令构建于现有的 Intel(R) 64 指令集架构(ISA)之上,并支持在所有规模的市场中推出微处理器,从而为广泛的 32 位和 64 位应用提供卓越的性能和出色的能效表现。这些新指令包括:

  *SIMD 流指令扩展 4 (SSE4)

  对于大多数应用而言,这种指令提供的构建模块具有更出色的能效表现,可提供更为广泛的能力和更强大的性能。

  *应用目标加速器

  将为目标应用提供低延迟、低功耗、固定功能等能力奠定坚实的基础。

  在英特尔宏伟的发展蓝图中,这些指令的出现代表了下一代芯片工艺和处理器架构的性能已经提高到了一个全新高度。包括图形、视频编码和处理、三维图像、游在内的诸多应用及 Web 服务器应用服务器都将从中收益。此外,许多高性能应用也将受益于这些指令,如数据采掘、数据库、复杂搜索和模式匹配算法、音频、视频、图像和数据压缩算法、解析和基于状态机的算法以及其他更多应用。

  本白皮书将简要介绍 ISA 的相关知识,并对 SSE4 矢量化编译器和媒体加速器、高效加速字符串和文本处理以及应用目标加速器等新指令进行说明。

  引领指令集新变革

  英特尔利用 ISA 使其微体系结构更强大,同时在各代处理器之间保持了必要的应用级兼容性。保持指令集兼容性的有力证明就是英特尔(R) 酷睿(TM)2 双核处理器。这款处理器采用了与前代英特尔(R) 奔腾(R) D 处理器几乎相同的 ISA 版本,尽管二者的内部设计不尽相同,但英特尔(R) 酷睿(TM)2 双核处理器却具有应用级兼容性。几乎所有构建用于支持英特尔(R) 奔腾(R) D 处理器的应用无需任何更改,即可运行于英特尔(R) 酷睿(TM)2 双核处理器之上。更妙的是,几乎所有运行于英特尔(R) 酷睿(TM)2 双核处理器上的应用都能够获得卓越的性能,并拥有出色的能效表现。与英特尔制程技术与微体系结构一样,英特尔指令集也在持续演进,并保持着稳步的发展步伐。对于每一次新演进:

  1. 英特尔对现有的指令进行了更新,使其从最新的微体系结构改进中获得最大优势,且无需任何更改即可为现有应用带来更强大的性能和更出色的能耗表现。

  2. 此外,英特尔还推出新指令集,专门用于优化广泛的现有应用和新应用的性能,并满足降低功耗的需求,为了高效地利用这些新指令的优势,还需要利用英特尔及其他厂商提供的最新编译器对现有应用进行重新编译。(如欲了解详细信息,请访问www.intel.com/software)。

  微体系结构和指令集架构

  为了认识到这新指令的优势,您需要了解在开发当今微处理器过程中所使用的不同架构及其所发挥的作用。

  * ISA 是与编程有关的整体计算机架构的组成部分,包括本地数据类型、指令、寄存器、寻址模式、中断和异常处理以及外部 I/O。此外,一个 ISA 还具有一个根据特定微处理器设计而实施的操作代码规范(机器指令)。在处理器家族中,通常,随着新指令的加入,ISA 的功能愈加强大,并将提供更卓越的性能、拥有更出色的能效表现,同时还保持了与现有应用的兼容性。

  *微体系结构是指芯片中 ISA 的设计、布局与实施,其中包括整体的模块设计、内核、执行单元和类型(如浮点型、整数分支预测及 SIMD 等)、流水线、高速缓存设计以及外围设备支持等。在处理器家族中,通常,随着新指令的加入,微体系结构的性能、能效与功愈加强大,同时还保持了与ISA 的兼容性。

  英特尔在 ISA 方面的领先优势已扩展至广泛的操作系统价值链中,这些操作系统包括, Microsoft Windows* 和 Vista*、UNIX*、Linux* 以及目前的Macintosh*。我们将继续致力于为行业扩展 ISA:

  *通过扩大行业价值链的支持范围,在所有操作系统上确保架构的一致性。

  *为 32 位和 64 位扩展提供统一的方案,以便实现出色的技术创新。

  *在开发新指令的过程中听取软件开发商和独立软件厂商(ISV)的意见,以便帮助开发商与我们展开更轻松愉快的合作,从而走向成功。

  *确保现有应用正确运行、应用性能更出色。

  *确保使用新指令的应用正常运行,且应用性能和能效表现更出色。

  *英特尔 ISA 保留了非分段特性,并作为一项标准加以执行,从而简化了 ISV 团队的工作流程,与其它架构厂商相比,英特尔在 ISA 方面具有领先优势。

  ISA的发展进程

  开发人员知道,通过增加同时处理的指令数量,他们可缩短应用用于代码请求(多个处理器周期处理数据)的时间。长期以来,英特尔鼓励这种代码实践,以便帮助提高整体的处理器吞吐率。英特尔很早就开始推行前瞻性计划,旨在通过开发特定的指令集来提高英特尔处理器运行的应用的性能,其中包括面向8086 芯片的浮点型(FP)指令集扩展。最近的开发的相关技术包括单指令、多数据流(SIMD)和英特尔(R)MMX(TM) 技术。英特尔开发出的 SIMD 技术相当出色,通过使用同时在多个数据段上运行的特定的指令,可在 P5 微体系结构上提高并行性。采用英特尔(R) MMX(TM)技术指令集,程序员能够在加载至 MMX 技术寄存器中的多个数据元素上运行指令,在诸如图形、游戏、视频流及其它媒体应用中,这些寄存器可提供出色的性能。在 P6 微体系结构中,英特尔介绍了 SIMD 流指令扩展(SSE)。专为英特尔(R) 奔腾(R)III 处理器而设计的 SSE 扩展了 MMX 技术,并支持利用 128 位寄存器(称为 XMM0-XMM7)在四个单精度 FP 数据元素上同时执行 SIMD 计算。借助英特尔(R) NetBurst(R) 微体系结构(英特尔(R) 奔腾(R) 4 处理器),英特尔推出了 SSE2,进一步扩展了 SSE(和 MMX 技术)。通过扩展 MMX 技术和 SSE 的指令,SSE2 能够并行执行更多计算,并可为 128 位整数和双精度 FP 数据类型提供支持。SSE2 共添加了 144 条能够在广泛的应用上提升性能的指令。

  例如,在执行算法并提升 MPEG-2 视频、MP3、3D 图形等更多软件性能的过程中,SSE2 指令可为软件开发人员提供最大程度的灵活性。

      下面是 英特尔架构(IA)指令集


比特微信账号
比特微信账号

微信扫一扫
关注Chinabyte

返回首页 长微博 返回顶部