英特尔推出全新 AVX10 指令集架构,为 E 核带来 AVX-512 功能

7 月 25 日消息,英特尔今日发布了全新的高级性能扩展指令集 (APX),并介绍了即将为 P 核和 E 核提供统一 AVX-512 支持的新型 AVX10 指令集。

简单来说,AVX10(Advanced Instruction Extensions 10) ISA 是 AVX-512 的超集,并具有 256bit 和 512bit 寄存器大小的所有 AVX-512 ISA 功能。

提醒,这种新的指令集暂时没有英特尔 CPU 支持 —— 它预计将在未来的芯片中出现,包括“Granite Rapids”。英特尔表示,AVX10 将成为其面向未来消费者和服务器处理器的矢量 ISA 选择。

从最基本的层面来看,AVX10 将使同时具有 E 核和 P 核的英特尔芯片支持 AVX-512,尽管 512bit 版本只能在 P 核上运行,不过 256bit 的 AVX-256 模拟指令集可以同时在 P 核和 E 核上运行。

据介绍,AVX10 将包括“带有 AVX512VL 功能标志的 AVX-512 矢量指令、最大矢量寄存器长度为 256bit 以及八个 32bit 掩码寄存器,以及支持嵌入式舍入的新 256bit 指令”。

这个版本可以在 P 核和 E 核上运行,但 E 核限制为最大 256bit 长度,而 P 核可以使用完整的 512bit 矢量,这一点类似于 Arm 通过 SVE 对可变矢量宽度的支持。

英特尔表示,现有应用程序在 AVX10 上的性能与 AVX-512 相同,至少在相同的矢量长度上。英特尔还声称:

  • 英特尔 AVX2 编译的应用程序重新编译为 AVX10 后无需额外软件调整即可实现性能提升。

  • 得益于新增的 16 个矢量寄存器和新指令,对于矢量寄存器压力敏感的英特尔 AVX2 应用程序可获得大幅性能提升。

  • 高度线程化的可矢量化应用程序在使用基于 Intel Xeon E 内核的处理器或具有混合架构的 Intel 产品时,可能实现更高的总吞吐量。

后续,英特尔将为消费级客户提供 Meteor Lake,为 HPC 客户提供 Granite Rapids 和 Sierra Forest,而这三个系列均采用类似的架构,其 P 核为 Redwood Cove 核,E 核则基于 Crestmont 架构。

据悉,英特尔将从第六代 Xeon“Granite Rapids”芯片开始支持 AVX10 首个版本(AVX10.1),但该版本只支持 512bit 矢量指令,而不是新的 256bit 矢量指令。

也就是说,这一代只是作为从 AVX-512 到 AVX10 的过渡芯片。不过,未来所有的 Xeon 处理器本身就会继续支持完整的 AVX-512 指令,以确保传统应用正常运行。

后续的 AVX10.2 将支持 256bit 矢量长度和其他新功能,如新的 AI 数据类型和转换、数据移动优化和标准支持。

为了解决开发者的担忧,英特尔还计划为 AVX10 实现与 AVX-512 相比大大简化的枚举方式,并确保每次转向新修订版时都有足够的新指令和功能值得升级变,从而减少版本和枚举膨胀。

栏目推荐