SSE4 高效加速字符串和文本处理
SSE4 可提供最新的字符串和文本处理指令,这些指令将提高字符串和文本处理的运算的性能,从而增强广泛的数据处理搜索及其它文本应用的性能。此外,这些指令还将包括高级压缩字符串对比指令(advanced packed string comparison instruction),这样一条指令可执行多种比较和搜索运算。总体而言,每一种新指令都具有丰富的创新字符串处理能力,足以在运算中替代前一代 ISA 中的指令,且能够提供相同的功能。
将从中获益的应用包括:数据库、文本搜索、病毒扫描、字符串处理库(如 ZLIB)、令牌解析(Token parsing)/识别应用(如编译器和面向状态机的应用)。

应用目标加速器概述
应用目标加速器可扩展英特尔(R) 架构的能力,通过在处理器芯片上增加性能优化、低延迟、低功率的固定功能加速器,使应用的性能获得大幅提升。这类加速器是在处理器中更出色实施固定功能能力的最初演进成果。 如果45 纳米向 32 纳米芯片技术的演进将使晶体管支持更多内核和高速缓存,这样还可支持芯片上固定功能的实施。在处理特定应用过程中,这些出色的能力将会实现性能提升,并带来出色的能效表现。
应用目标加速器的首要功能是在数据完整性应用中加速循环冗余校验(CRC)的计算过程。这种新的 CRC 指令将能促使基于处理器的 CRC 操作更快,能够以低于独立专用芯片的成本实现高效的数据完整性校验,比如在网络小型计算机系统接口(iSCSI)、远程直接内存存取(RDMA)等上层数据传输协议中 CRC 能力往往是整个系统的瓶颈所在,在任意的用户环境联网存储中,基于处理器的 CRC 操作将支持高数据传输速率的企业级数据保障。否则,服务提供商不得不得在系统中安装非常昂贵的且耗电的加速卡来确保性能。凭借基于英特尔(R) 酷睿(TM) 微体系结构的多核处理器的强大性能,新的 CRC 指令将加速目标网络协议(如 iSCSI 和 RDMA)的性能,且无需添加任何成本。这有助于广泛实施基于低成本存储域网络的 iSCSI 解决方案。此类网络可作为主要的可选方案来替代更加昂贵的光纤信道网络,并可使众多企业以较低成本即可解决数据存储问题。
此外,英特尔的应用指令扩展集可提供高效加速相关大型数据集搜索的单指令 POPCNT,该指令用于计算数据对象中的位的数目。基因挖掘、手写识别、数字化健康工作量和汉明距离/人口快速计算等应用都可因执行该指令而获得性能的提升。

总结
自 SSE2 出现以来,作为最大范围、最具影响力的 ISA 扩展指令集,SSE4 和应用目标加速器标志着英特尔指令集已达到了一个重要的里程碑,借助该指令集,英特尔将推出具有更卓越性能、更出色能效表现的产品,并将在未来利用可扩展功能实现更大价值。英特尔凭借其在英特尔架构指令集扩展领域的领先优势及不懈努力,为提高广泛软件的性能、功效和能力铺平了持续发展的道路。借助 SSE4 和应用目标加速器,英特尔将继续与 ISV 团队通力协作,致力于提供指令集扩展,使这些指令集真正提高产品性能,从而为我们的客户带来实际的优势(从提高性能到显著节约成本)。