大脑号推出第二代“巨核”:采用TSMC 7纳米工艺 与餐盘

美国硅谷初创公司大脑系统公司(Cerebras Systems)推出了新的晶圆级引擎2(WSE-2)处理器,该处理器专为超级计算任务而构建,拥有创纪录的2.6万亿晶体管(市场上最大的GPU只有540亿个晶体管)和85万个AI优化内核。它与餐盘大小相似,采用TSMC的7纳米工艺。

这是大脑第二次用整个300毫米的晶片制造单个芯片。这么大的晶圆,一般都是切成几百个独立的芯片,但是大脑使之成为一个芯片。在巨大的体积下,相比同等计算能力的GPU集群,该芯片功耗更低,占用空间更少。

WSE-2与最大的图形处理器相比

一、Cerebras 估值约 24 亿美元,创始人斯坦福出身

大脑系统公司位于美国加州,成立于2016年。该公司专注于计算机系统的深度学习。目前,公司在硅谷、多伦多、东京设有办事处,2019年11月赢得E轮融资4.75亿美元。融资后,大脑系统公司的价值约为24亿美元。

安德鲁费尔德曼是大脑公司的联合创始人和首席执行官。他拥有斯坦福大学学士学位和工商管理硕士学位。他曾经创立过Seammicro,专注于超高密度计算机服务器业务。Seammicro于2012年被AMD以3.57亿美元收购。

安德鲁费尔德曼,大脑公司联合创始人兼首席执行官

2019年,大脑发布了第一代WSE芯片,该芯片拥有40万个内核和1.2万亿个晶体管,采用TSMC的16纳米工艺。

二、WSE-2 性能参数超竞品几个数量级,良率更高

WSE-2仍由TSMC制造,但采用了更先进的7纳米工艺。与第一代芯片相比,WSE-2的晶体管数量、内核数量、内存、内存带宽和结构带宽等性能特征翻了一番多。由于WSE-2采用7纳米工艺,电路之间的宽度只有十亿分之一米。

如此巨大的芯片尺寸使WSE 2号的性能有了很大的提高。这种芯片的性能参数比竞争产品高几个数量级,可以大大缩短AI训练时间。

与竞争对手GPU相比,WSE-2的内核数量增加了123倍,内存增加了1000倍,内存带宽增加了12000倍,带宽增加了45000倍。

WSE、WSE-2与英伟达A100GPU性能参数对比

费尔德曼指出,通过放大和互连芯片,大量数据可以保留在芯片上。与普通GPU集群相比,WSE 2具有更低的延迟和能耗。在提供相同计算能力的情况下,普通GPU集群会需要几十个机架,花费几个月的时间进行配置和编程,功率会高达数百瓦。

与GPU相比,WSE-2仍然有很多核心冗余。如果一个内核出现故障,单个出现故障的内核不会影响芯片的使用。然而,在像TSMC这样的晶圆代工厂中,很少有连续的核心缺陷,因此WSE-2的产量很高。

从010年到1010年的国际研究机构摩尔洞察与战略(Moor Insights&Strategy)的分析师帕特里克摩尔海德(Patrick Moorhead)认为,WSE 2核的数量带来的性能确实对NVIDIA的GPU构成了一定的挑战。然而,英伟达的解决方案更加灵活,几乎可以安装在任何服务器机箱中。

Tirias Research首席分析师吉姆麦格雷戈(Jim McGregor)在一封电子邮件中写道,尽管大脑在数百万种人工智能算法方面不如NVIDIA全面,但大脑的解决方案显然吸引了许多客户。

自2019年WSE芯片交付以来,过去一年中,许多重量级用户都使用了大脑产品。

比如阿贡国家实验室、劳伦斯利弗莫尔国家实验室、匹兹堡超级计算中心、爱丁堡大学超级计算中心、葛兰素史克、东京电子设备等。

全球制药巨头葛兰素史克(GlaxoSmithKline)的高级副总裁金布兰森(Kim Branson)称赞大脑增加了编码器模型的复杂性,并将训练时间减少到前一个模型的1/80。

美国最大的科学与工程实验室阿贡国家实验室(Argonne National Laboratory)将CS-1芯片用于癌症研究,将癌症模型的实验周转时间减少到1/300以下。

费尔德曼说,明年大脑将宣布其在重型制造、制药、生物技术和军事领域的成就。WSE 2号将被集成到CS-2超级计算机系统中,并将于今年第三季度发射。

三、Cerebras 拥有多位重量级客户

,脑科虽然没有英伟达全面,但WSE系列芯片并不是简单放大的。芯片尺寸这么大以后,互连技术、芯片封装、散热等问题都会发生很大的变化。

大脑解决了这些问题,并向我们展示了芯片尺寸不能仅仅凭借WSE-2的优势变得越来越小。

栏目推荐