Intel 与 AMD 联手推进 APX 指令集! x86 架构迎来史上最大变革,效能提升不增功耗

Intel 与 AMD 这对数十年来在 CPU 市场上正面厮杀的竞争对手,正通过 x86 生态系统顾问小组(EAG)持续深化合作。 继两天前联合发布ACE(AI Compute Extensions)AI矩阵加速指令集白皮书之后,EAG再度揭露了APX(Advanced Performance Extensions)的最新细节。 这项被称为「x86 自 64 位以来最大演进」的指令集扩充,将通用暂存器数量直接翻倍,并在不增加芯片面积与功耗的前提下显著提升效能。

APX 是什么? 为什么是 x86 的重大演进?

APX(Advanced Performance Extensions)是Intel与AMD共同制定的新一代x86指令集扩充标准。 它的核心精神非常直接:让 x86 指令集能够存取更多的寄存器(Registers)

暂存器是 CPU 内部容量极小但存取速度极快的储存单元,负责存放正在运算的数据、指令与内存地址。 当指令集能访问更多寄存器时,处理器就能在更短的时间内完成更多工作,因为大量数据可以直接在CPU内部处理,不需要频繁到速度较慢的内存中读写。

Intel 与 AMD 联手推进 APX 指令集! x86 架构迎来史上最大变革,效能提升不增功耗

这项规格早在2024年10月就由Intel首次提出,如今在EAG的框架下由Intel与AMD共同推动,并释出了更多技术细节。

APX 六大核心改进

APX 并非单一功能的补强,而是对 x86 指令集架构的一次系统性升级。 以下是主要改进项目:

通用暂存器(GPR)翻倍:由现有的16个一举扩充至32个。 这让编译器可以将更多数据与变量保留在暂存器中,而非写入速度较慢的内存,对代码编译与执行效率有直接帮助。

内存操作效率提升:经过SPEC CPU 2017整数基准测试的模拟验证,APX编译后的代码可减少10%的读取操作(loads)与20%的写入操作(stores),代表更快且功耗更低的程序执行。

非破坏性指令形式:传统x86 指令大多是破坏性的,运算结果会直接盖掉其中一个来源算子。 APX 新增了非破坏性版本,减少暂存器复制需求,让代码更简洁且执行更快。

条件执行扩充:过去 x86 的条件执行仅限于 CMOV 与 SET 等少数指令。 APX 新增了条件式读取(Conditional Load)、条件式写入(Conditional Store)、条件式比较/测试(Conditional Compare/Test)以及旗标抑制功能,大幅扩展 if-conversion 的应用范围,减少分支预测失误。

堆叠操作强化:新增PUSH2与POP2指令,可以在一次内存操作中同时推送或弹出两个暂存器,加速函式呼叫的进入与返回流程。

代码密度不变:尽管新增了大量指令与功能,APX 并不显著增加代码体积,并且完全向下兼容——既有的 x86 软件可以在支持 APX 的处理器上无缝执行。

与ACE指令集同属EAG框架下的战略布局

APX 的公布时间点极具战略意义。 就在两天前的4月30日,Intel与AMD才刚联合发布了ACE(AI Compute Extensions)技术白皮书,将其定位为x86架构的标准矩阵加速架构,支持INT8、FP8、BF16等主流AI数据格式,并兼容于AVX10指令集。

ACE 聚焦 AI 矩阵运算加速,APX 则专注于通用运算效能的全面提升:两者相辅相成,共同构成 EAG 对 x86 架构未来发展的完整蓝图。 EAG 自去年成立以来,陆续公布了FRED(弹性返回与事件递送)、AVX10(矢量指令集统一)、ChkTag(内存安全标签检查)以及ACE与APX等多项核心特性。

不用更大面积、不必更高功耗,效能自然提升

APX 最令人惊艳的特色之一,是这些效能提升几乎不需要额外的硅晶圆面积或功耗作为代价。 Wccftech 的报道强调,APX 可以在不显著增加核心面积与功耗的情况下,实现更高的通用运算效能:这对于芯片设计与散热解决方案来说,意义极为重大。

对开发者与消费者的意义

对于软件开发者而言,APX最大的价值在于编译器的优化空间大幅增加。 当编译器能够将更多变量保留在暂存器而非内存中,程序就能跑得更快、更省电。 尤其对于 LLVM 与 GCC 等主流编译器来说,APX 的 32 个通用暂存器将成为极具吸引力的编译目标。

对于一般消费者而言,APX带来的效益将间接体现在日常使用中:从网页浏览、文书处理到游戏与内容创作,支持APX的处理器将能以更低的功耗完成相同的工作,或在相同功耗下提供更流畅的效能表现。

结语

Intel与AMD从数十年的竞争对手,到如今在EAG框架下联手推进x86架构的演进:这不仅是为了对抗ARM与RISC-V的新兴威胁,更是对x86这套走过近半世纪的指令集架构注入全新生命力。 APX 的通用暂存器翻倍、ACE 的 AI 矩阵加速标准化,再加上 FRED、AVX10、ChkTag 等一系列基础架构革新,x86 的故事显然还没有写完。

(0)

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注