中科院人工智能团队发布新一代智能计算平台

从去年5月到今年6月,大规模预训练AI模型的参数规模已经从千亿直接突破一万亿。只有非常大的超级计算或人工智能计算中心才能支持这种规模的AI模型。放眼中国,能够支持如此庞大的模型预算的计算中心非常少。专家预测,模型训练的成本可以从几千万美元跃升到几十亿美元,从1000亿个模型跃升到几万亿个模型。

此外,人工智能在一些行业的应用非常成熟,而在其他很多行业还处于碎片化状态,但发展迅速。

无论从模型层面还是应用层面,国内对智能计算能力的需求都是巨大的。开发“新一代人工智能计算平台”的动机源于对我国人工智能应用现状的深刻理解。

2010年7月8 -10日,2021世界人工智能大会在上海召开。大会期间,中国科学院人工智能产学研创新联盟发布新一代人工智能计算平台。

中国科学院人工智能产学研创新联盟由中国科学院自动化研究所、计算技术研究所等AI相关研究机构和26家企业于2018年成立。目前有34个成员单位。

“中国科学院在人工智能领域产生了一大批具有国际领先水平的重大科研成果,具备全链条人工智能技术创新能力。它要承担起构建人工智能技术服务体系、深化AI技术推广应用的责任。”郭克控股党委副书记、副董事长、总经理杨建华认为,该平台集成了中科院人工智能技术的诸多成果,实施路径清晰,可为区域智能计算中心建设提供标准可复制的模式。

中国科学院科技战略咨询研究院院长潘表示,“智能数字基础设施建设已成为新基建的主导方向,事关国家整体发展和长远利益。只有制定开放、安全、绿色、包容的前瞻性战略规划,才能重塑数字产业化、产业数字化发展格局”。平台依托中科院顶层战略规划,汇聚计算力、算法、数据、软件、人才、应用等资源,将为AI产业化发展、行业号智能转型、政府智能治理提供有力支撑。

据现场介绍,该平台具有四大优势,即开放包容、普遍融合、绿色高效和无障碍。

一是采用开放架构,能够兼容主流软件应用生态,具有使用广泛、迁移灵活、编译开发难度低的特点;

第二:支持多芯片组合,提供多样丰富的计算能力,能够胜任仿真、训练、推理等AI全链应用需求;

三是底层计算基础设施采用相变浸没式液冷技术,单位计算效率大幅提升,能耗成本降低30%;

第四,通过透明价格模型,可以为市场提供参考和建设标准,有效避免公共财政资源的浪费。

其中,通用集成、开放包容、绿色高效是当前行业对智能计算中心的普遍要求。当然,这也是平台在行业中的基本优势,使其成为符合时代的新基础设施。但普惠体现了平台的独特性,为行业树立了新的标准。

新一代人工智能计算平台

大会的专家表示,新一代人工智能平台

专家还强调了多模态预训练大模型、科学人工智能等热门方向。“基于不同精度覆盖和通用集成的设计,该平台将成为未来这些研究方向的主要支撑平台。”

该平台支持浸没式液相变冷却,大大提高了其效率,单位计算密度较传统可提高10倍,冷却相关能耗可节省90%。释放芯片的更高性能,提高整个系统的可靠性,也是液冷技术的一大好处。结合液冷,可实现计算设施的立体组装,单位机房密度可达传统机房的30倍,大大降低了资金投入成本。

新平台:三大优势稳固基础

据现场介绍,新一代智能计算平台旨在提供通用AI计算能力。如何解读这种包容性?根据网上公开的信息,以国内4个人工智能计算中心相当于单位算力的建设成本投入为例,可以看到每100P16位算力最高投入为4.6亿,最低投入为7500万,相差6.2倍。

中国科学院计算技术研究所研究员、CCF高性能计算专业委员会秘书长张云泉表示:“如果没有明确的标准来区分,区域建设者很容易误判计算能力供给造成的资金和资源浪费。

针对价格乱象,平台给出了算力的价格标准方案:综合存储、能耗、开发、定制、数据调度等一系列因素,代入明确的算法标准,得出智能计算中心拥有5P双精度算力(64位)、25P单精度算力(32位)、100P半精度算力(16位)时的基础设施价格约为1亿

p>重视价格标准,一方面是源于联盟做这个平台的初衷,即降低 AI 算力的使用门槛,另外在建设过程中,专家也指出,联盟有责任和义务为国家节省相关的资源。

张云泉补充道,“新一代人工智能平台有力推动了算力定价标准的建设,为区域智算产业发展提供了重要的参考依据,将有效解决智能计算中心存在价格混乱虚高的问题。”

除了建设阶段需要节省成本,其实平台后期的运维运营阶段也非常重要。除了通过液冷技术,还有一个很重要的方向:平台在设计的时候,不只是面向单一一个计算中心,而是考虑了跨地域的多个中心的资源协同。

通过统一认证、数据打通等技术,可以实现不同地域的人工智能计算中心的统一服务入口。同时在这个框架下,不同的计算中心也可以实现便捷的资源交易和结算。也就是说,为了降低建设成本、运营成本,集约化建设模式将成为风向标。

通过这种方式,可以搭建和形成具有不同地域特色或者行业特色的智能计算中心,然后通过平台,实现算力经济的共享,张云泉总结道,“这是从更大的层面实现了资源的整合,我们进一步提高了各个中心的资源利用率,减少了重复建设。”

此外,降低人工智能的应用门槛和技术门槛,以平台的形式向公众提供算力资源和算法服务,也是智能计算中心作为公共服务的必然趋势。“算力将越来越接近一种商品,首先它的价格会越来越便宜,其次通过网络,包括云计算技术等也使得我们可以在整个社会层面来供应各种各样的算力。”

在中科院人工智能产学研创新联盟、中国智能计算产业联盟等权威组织机构推动下,智能计算将树起价格标杆。各大算力供给方和区域算力中心建设方也应合力推进行业透明化、标准化发展,避免智算中心建设走弯路、花冤枉钱。

“新基建 新标准”,是对新一代人工智能计算平台的定位的精准总结。新基建决定了基础设施体系未来所承载的发展愿景与空间,而以平台为代表的智能新基建将顺应自然空间、机器物理空间、虚拟信息空间的融合趋势,成为现代化强国基础设施的内核。

栏目推荐