英特尔推出适用于AI和数据中心的4插槽和8插槽平台的第三代可扩展至强处理器
英特尔今天发布了针对四插槽和八插槽服务器的第三代可扩展至强处理器家族(代号为Cooper Lake),其目标是在数据中心中运行的AI和分析工作负载。总共发布了11个新的SKU,它们具有16-28个内核,高达3.1 Ghz的基本时钟(使用Turbo Boost时高达4.3 Ghz),并支持多达六个存储通道。
英特尔表示,与具有五年历史的标准(Haswell)平台相比,Cooper Lake在云数据分析使用模型上的平均性能提高了1.92倍,数据库性能提高了1.98倍。Supermicro和Lenovo是今天宣布针对新Intel处理器进行了优化的服务器的系统制造商。
Cooper Lake的发布引入了Intel Optane持久内存200系列,据英特尔称,该系列平均提供比上一代产品多25%的内存带宽。与Optane 100系列一样,Optane 200提供128 GB,256 GB和512 GB模块,可以与主板上的传统DDR4 DIMM并排放置。一个插槽中最多可容纳六个模块,每个插槽可提供3 TB的持久内存,每个插槽可提供4.5 TB的总存储容量。
Cooper Lake采用Intel 14nm ++工艺制造,是首款通过内置于Intel Deep Learning Boost(DL Boost)技术中的新bfloat16支持提供内置AI训练加速的x86处理器。英特尔将bfloat16描述为“一种紧凑的数字格式,使用的比特数仅为今天的FP32格式的一半,但是只需很少(如果有)的软件更改就可以达到可比的模型精度。”
借助这些新的AI功能,与英特尔基准测试中的四路Cascade Lake参考平台相比,四路Cooper Lake平台在图像分类方面的AI训练性能提高了1.93倍,AI推理性能提高了1.87倍。在另一项内部测试中,英特尔展示了自然语言处理的BERT吞吐量,其AI培训性能比Cascade Lake高出1.7倍。
TIRIAS Research的首席分析师Kevin Krewell认为DL Boost和bfloat16是Intel的关键技术,具有重要的竞争优势。“使用DL Boost和bfloat16进行AI加速是一个真正创新的解决方案,” Krewell说。“它使您可以提高性能并节省更多能量,以完成相同的工作负载。通过添加这种类型的指令创新,这就是英特尔保持领先于AMD的一种方式。在使更多的内核进入相同的功率范围并提高两路和单路的性能方面,AMD所做的出色,而AMD仍然落后于英特尔在服务器产品中添加机器学习技术。
英特尔报告称,在四插槽和八插槽市场中,特别是在大型云服务提供商中,对DL Boost和bfloat16的需求。一位公司代表告诉我们:“ Facebook一直在谈论在其基础架构中使用我们的第三代Xeon处理器的声音最大。” Facebook在5月宣布新的Xeon服务器CPU将为其更新的Open Compute Platform奠定基础。 (OCP)服务器。“阿里巴巴,腾讯和百度也是该技术的坚定倡导者。与FP32相比,BF16为这些客户和其他客户提供了更高的性能,而没有损失准确性。将BF16添加到我们的DL Boost功能集中(还包括INT8和FP32),使我们能够继续为客户提供内置在主流服务器CPU中的高级AI功能。”
新处理器还引入了增强的Intel Select Speed技术。Intel Select Speed技术与第二代可扩展Xeon处理器一起推出,可为用户提供对特定内核的基本间隔频率的控制,从而使他们能够最大化最高优先级工作负载的性能。“您可以将其视为服务质量的一种功能类型,它使您可以将最重要的流量放在工作量的最重要部分中,以便确保最佳响应,然后超高效地利用其余可用的计算资源英特尔公司至强和内存事业部副总裁兼总经理Lisa Spelman说。
Cooper Lake SKU根据支持的功能进行区分,并非所有SKU都支持所有功能。SKU堆栈的顶部是Intel Xeon Platinum 8380H和8380HL处理器,该处理器具有28个内核,2.9 GHz的基本频率(升压时最高可达4.3 Ghz),250瓦TDP中的38.5 MB高速缓存,支持四核或八核。套接字平台。-L名称代表“大内存”,并表示通过Optane持久内存和DRAM的组合,每个插槽最多支持4.5 TB的内存。Platinum 8380H支持英特尔DL Boost进行AI培训。18核Intel Xeon Platinum 8354H处理器是唯一在训练和推理上均支持Intel DL Boost的处理器。英特尔提供 了参考指南 ,其中显示了每个SKU支持的功能以及 SKU表。
最初,Cooper Lake旨在用于各种数据中心平台,包括两路服务器以及多芯片模块封装中的 插槽式56核部件,但英特尔缩减了产品系列,以满足Cascade Lake之间的临时需求。 刷新 和即将到来的Ice Lake服务器CPU。
“我们觉得与Cascade Lake Refresh一起完成的工作得以解决,并帮助满足了我们一直试图解决的一系列市场需求(“从上到下” Cooper Lake);第四和第八插槽以及对第二代Optane持久存储的需求是更紧迫或普遍的机会,” Spelman说。“当我们研究所有这些如何结合在一起时,我们感到Cascade Lake Refresh为性能和可升级性提供了一条超快的途径,Cooper Lake提出了四插槽和八插槽的问题,然后是Ice Lake提出了更为主流的两插槽问题。感觉很合适,这给了我们消除一些拥塞的机会。”
斯佩尔曼表示,Ice Lake是英特尔向Cooper Lake的10nm继承者,该产品有望在今年晚些时候推出。
英特尔还报告说,紧随冰湖之后的下一代10纳米服务器芯片Sapphire Rapids最近已完成加电,该公司正在测试其功能,包括下一代AI加速功能,称为英特尔Advanced Matrix Extensions或AMX。英特尔表示,这将进一步提高训练和推理性能。Spelman说,AMX规范将在本月发布,使开发人员有机会开始对其进行准备并优化其底层软件。
第三代Intel Xeon可扩展处理器和Intel Optane永久性内存200系列模块现已向客户发货。Facebook,阿里巴巴,百度和腾讯已经宣布了采用CPU的计划。OEM系统有望在2020年下半年开始发货,Supermicro和Lenovo今天宣布了升级的服务器,这些服务器利用了新的Xeon处理器和Optane 200系列内存模块。