消息称英伟达计划 Q2 向中国市场推出特供版 H20 芯片

1 月 9 日消息,据路透社,英伟达计划于 2024 年第二季度开始量产中国特供的 AI 芯片,以遵守美国出口管制新规,其中最强的型号就是 H20。英伟达对此拒绝置评。

除了 HGX H20 之外,英伟达还计划推出另外两款符合美国限制的 PCIe 芯片 ——L20 和 L2,但具体信息不详。

消息人士透露,H20 原定于去年 11 月推出,但该计划由于“服务器制造商在集成该芯片时遇到了问题”而被推迟。其中一位知情人士表示,初期产能十分有限,英伟达需要首先满足主流客户的订单。

根据 SemiAnalysis 分析,H20、L20 和 L2 包含英伟达大部分用于 AI 工作的功能特性,但为了遵守新规则,这三款新品在算力方面有所削减;不过在 LLM 推理中依然要比 H100 快 20% 以上。

查询公开资料获悉,NVIDIA H100 Tensor Core GPU 采用全新 Hopper 架构,基于台积电 N4 工艺,集成了 800 亿个晶体管。与上一代产品相比,可为多专家 (MoE) 模型提供高 9 倍的训练速度。

它配备第四代 Tensor Core 和 Transformer 引擎(FP8 精度),还具有高度可扩展的 NVLink 互连技术(最多可连接达 256 个 H100 GPU,相较于上一代采用 HDR Quantum InfiniBand 网络,带宽高出 9 倍,带宽速度为 900GB/s)等功能。

栏目推荐