中国智算破纪录!起底全球最大规模超节点,有何过人之处?

690da40738567
编辑/Tina
校对/雷晶

 

国产算力进入狂飙时刻。昨日,中科曙光发布的全球首个单机柜级640卡超节点,彻底点燃了中国智算市场。看点不仅在于其算力集成度突破业界天花板,加速卡数量直接飙升到“昇腾384”近两倍,算力密度还实现了最大20倍提升,连续多个“世界之最”着实让人提气。

不过,更让人关注的是,这款被称为“曙光scaleX640”的超节点,完全基于AI计算开放架构设计,可直接对标英伟达实现业务平滑迁移。显然,这是直接奔着行业老大哥去的。考虑到国产替代趋势下的绝佳窗口期,“后英伟达”时代或迎来又一位新王。

 

01
单机柜640卡破纪录,四张“底牌”技压群雄

 

近年来,面对AI大模型创新带来的集群式计算需求,超节点玩家纷纷展开加速卡“积木竞赛”。如何集成更多AI芯片实现更高效的算力互联,成为全球智算产业命题。强势如英伟达,最近貌似也从单卡性能突破分出精力,开始重点着眼于“AI工业革命基础设施”的构建。

放眼国内,国产超节点更是将油门踩进了油箱。比如此前昇腾超节点将加速卡规模推向384张新高度,几乎在全球范围内占位领先。短短半年之后,这项记录再次被曙光scaleX640打破,并且在各项向标实现倍数增长,深度演绎了从单点突破到系统创新的“中国速度”。690da44e2a546

 

 

 

认真盘点了一下“乌镇世界互联网大会”上的产品信息,概括来说,曙光scaleX640主要掏出四张“底牌”,即“超强性能”、“极致效率”、“全面开放”、“超高可靠”。

超强性能:采用“一拖二”高密架构设计,实现单机柜640卡超高速总线互连,构建大规模、高带宽、低时延超节点通信域,双scaleX640超节点组成1280卡计算单元,柜间通过高速网络互连,液体冷凝换热装置CDM为千卡级计算单元提供高达1.72MW的超级散热能力。

极致效率:MOE大模型训练效率与高通量推理吞吐性能大幅提升30-40%,基于超高速正交架构、超高密度刀片、浸没相变液冷、高压直流供电等多技术融合创新设计,成为业界最高集成度的液冷超节点,单机柜算力密度最大增幅达20倍,PUE值低至1.04。

全面开放:基于AI计算开放架构,适配支持多品牌AI加速卡,可以为用户提供更多灵活选择;全面兼容主流AI计算软件生态,适配优化400+主流大模型,支持AI模型、业务应用快速无缝迁移与深度优化。

超高可靠:从单机RAS特性到集群智能运维与故障恢复机制,采用多层级多维度可靠性设计,通过30天+长稳运行可靠性测试验证,保障十万卡级超大规模集群扩展部署。

横向对比后可以发现,上述四张牌摆上台面,现阶段超节点玩家中几乎都得回一句“要不起”。即便英伟达的GB200 NVL72计算托盘,也仅包含36个Grace CPU和72个Blackwell GPU,在算力集成规模、开放程度、液冷散热方面,照样被scaleX640吊打。

当然,算力最终的落点还是在于应用。依照中科曙光官方表述,这次的超节点新品主要为MOE大模型训练、高通量推理、科学智能(AI for Science)等前沿AI创新应用场景而来——目标是在国产AI最要劲儿的地方,提供最强劲的国产智算引擎。

 

02
跨层协同攻克生态堵点,系统性赶超单卡差距

 

客观来看,国产超节点的跃迁式突围,源于全产业链的协同发力。从scaleX640架构设计理念可窥一斑:通过产业跨层协作构建全栈一体化生态,成为赶超国际芯片巨头的必由路径。

众所周知,国产AI芯片在单卡性能方面,与英伟达的先进GPU仍存在差距。甚至不要说当打之年的GB200,即便“阉割版”H20,上半年在国内照样很受互联网厂商欢迎。目前,英伟达因安全性问题逐渐淡出中国市场,某种程度上也为国产算力赶超按下了加速键。

业内主流观点认为,要解决算力性能瓶颈,必须在不断突破AI芯片研制水平的基础上,将智算集群各个子系统高效统合起来,围绕GPU核心进行一体化紧耦合设计。“只有深度挖潜国产计算系统的整体实力,才能尽快弥补单点性能的绝对落差。”

然而,大规模智算集群由算、存、网、电、冷、管等诸多子系统构成,组件数以十万、百万计,软硬件系统耦合要求极高,技术难点非常多,研发周期长。在此背景下,产业上下游亟需以更开放的姿态,制定统一的接口规范和协同标准,真正打破全栈生态堵点形成产业合力。

不得不说,中科曙光在这方面确实分外积极。据说早在其AI计算开放架构发布之初,该厂商就提出了五层技术能力开放和产业深度协作模式——前者主要围绕“部件-系统-基础设施-软件-数据集”,全方位构筑开放式计算生态;后者则依托国家先进计算产业创新中心,联动产业各方打造出“AI计算开放架构联合实验室”,深入推进产业链跨层优化协作。

这一套组合拳下来,产业上下游有了一系列明确的工作目标。比如开展底层基础软件与工具链协同优化、模型-硬件协同设计与深度优化、异构算力资源统一调度与管理、开放标准与接口的制定和推广、关键场景跨层优化验证与示范等。最终目的是逐一击破“硬件墙”、“软件墙”、“生态墙”壁垒,充分释放出国产计算体系的综合战力。690da45c196ed

很明显,scaleX640就是这一协作模式下的产物,其前景也远非单一厂商主导的超节点产品可比。所以说,国产计算集群的未来必须打破门户之见,因为它的本质是由长下游全栈深度协作而成的动态图景,具备天然的内生动力和可成长性,唯有开放协同才能发挥其真正潜力。

某位业内前辈指出,随着摩尔定律的终结,当前英伟达等国际芯片巨头也开始侧重于“系统极致协同”策略。曙光scaleX640遵循全栈共创的开放式路线,率先引领国产超节点在集群协同效率上完成突破,并且全面兼容主流生态,可以高度对标NV展开新一轮体系化比拼。

“在这场算力规模更大、产业链条更长、系统范围更广的较量中,国产厂商有望进一步强化‘团战能力’,在全球算力产业格局中夺得优势生态位。”圈内对此抱有极大信心。

本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系AG旗舰厅 (中国大陆) 有限公司官网,本站将会在24小时内处理完毕。/74803.html

(0)
上一篇 2025年10月21日 下午3:35
下一篇 2025年11月10日 上午11:50

相关推荐