中国智算破纪录！起底全球最大规模超节点，有何过人之处？

编辑/Tina

校对/雷晶

国产算力进入狂飙时刻。昨日，中科曙光发布的全球首个单机柜级640卡超节点，彻底点燃了中国智算市场。看点不仅在于其算力集成度突破业界天花板，加速卡数量直接飙升到“昇腾384”近两倍，算力密度还实现了最大20倍提升，连续多个“世界之最”着实让人提气。

不过，更让人关注的是，这款被称为“曙光scaleX640”的超节点，完全基于AI计算开放架构设计，可直接对标英伟达实现业务平滑迁移。显然，这是直接奔着行业老大哥去的。考虑到国产替代趋势下的绝佳窗口期，“后英伟达”时代或迎来又一位新王。

单机柜640卡破纪录，四张“底牌”技压群雄

近年来，面对AI大模型创新带来的集群式计算需求，超节点玩家纷纷展开加速卡“积木竞赛”。如何集成更多AI芯片实现更高效的算力互联，成为全球智算产业命题。强势如英伟达，最近貌似也从单卡性能突破分出精力，开始重点着眼于“AI工业革命基础设施”的构建。

放眼国内，国产超节点更是将油门踩进了油箱。比如此前昇腾超节点将加速卡规模推向384张新高度，几乎在全球范围内占位领先。短短半年之后，这项记录再次被曙光scaleX640打破，并且在各项向标实现倍数增长，深度演绎了从单点突破到系统创新的“中国速度”。

认真盘点了一下“乌镇世界互联网大会”上的产品信息，概括来说，曙光scaleX640主要掏出四张“底牌”，即“超强性能”、“极致效率”、“全面开放”、“超高可靠”。

超强性能：采用“一拖二”高密架构设计，实现单机柜640卡超高速总线互连，构建大规模、高带宽、低时延超节点通信域，双scaleX640超节点组成1280卡计算单元，柜间通过高速网络互连，液体冷凝换热装置CDM为千卡级计算单元提供高达1.72MW的超级散热能力。

极致效率：MOE大模型训练效率与高通量推理吞吐性能大幅提升30-40%，基于超高速正交架构、超高密度刀片、浸没相变液冷、高压直流供电等多技术融合创新设计，成为业界最高集成度的液冷超节点，单机柜算力密度最大增幅达20倍，PUE值低至1.04。

全面开放：基于AI计算开放架构，适配支持多品牌AI加速卡，可以为用户提供更多灵活选择；全面兼容主流AI计算软件生态，适配优化400+主流大模型，支持AI模型、业务应用快速无缝迁移与深度优化。

超高可靠：从单机RAS特性到集群智能运维与故障恢复机制，采用多层级多维度可靠性设计，通过30天+长稳运行可靠性测试验证，保障十万卡级超大规模集群扩展部署。

横向对比后可以发现，上述四张牌摆上台面，现阶段超节点玩家中几乎都得回一句“要不起”。即便英伟达的GB200 NVL72计算托盘，也仅包含36个Grace CPU和72个Blackwell GPU，在算力集成规模、开放程度、液冷散热方面，照样被scaleX640吊打。

当然，算力最终的落点还是在于应用。依照中科曙光官方表述，这次的超节点新品主要为MOE大模型训练、高通量推理、科学智能（AI for Science）等前沿AI创新应用场景而来——目标是在国产AI最要劲儿的地方，提供最强劲的国产智算引擎。

跨层协同攻克生态堵点，系统性赶超单卡差距

客观来看，国产超节点的跃迁式突围，源于全产业链的协同发力。从scaleX640架构设计理念可窥一斑：通过产业跨层协作构建全栈一体化生态，成为赶超国际芯片巨头的必由路径。

众所周知，国产AI芯片在单卡性能方面，与英伟达的先进GPU仍存在差距。甚至不要说当打之年的GB200，即便“阉割版”H20，上半年在国内照样很受互联网厂商欢迎。目前，英伟达因安全性问题逐渐淡出中国市场，某种程度上也为国产算力赶超按下了加速键。

业内主流观点认为，要解决算力性能瓶颈，必须在不断突破AI芯片研制水平的基础上，将智算集群各个子系统高效统合起来，围绕GPU核心进行一体化紧耦合设计。“只有深度挖潜国产计算系统的整体实力，才能尽快弥补单点性能的绝对落差。”

然而，大规模智算集群由算、存、网、电、冷、管等诸多子系统构成，组件数以十万、百万计，软硬件系统耦合要求极高，技术难点非常多，研发周期长。在此背景下，产业上下游亟需以更开放的姿态，制定统一的接口规范和协同标准，真正打破全栈生态堵点形成产业合力。

不得不说，中科曙光在这方面确实分外积极。据说早在其AI计算开放架构发布之初，该厂商就提出了五层技术能力开放和产业深度协作模式——前者主要围绕“部件-系统-基础设施-软件-数据集”，全方位构筑开放式计算生态；后者则依托国家先进计算产业创新中心，联动产业各方打造出“AI计算开放架构联合实验室”，深入推进产业链跨层优化协作。

这一套组合拳下来，产业上下游有了一系列明确的工作目标。比如开展底层基础软件与工具链协同优化、模型-硬件协同设计与深度优化、异构算力资源统一调度与管理、开放标准与接口的制定和推广、关键场景跨层优化验证与示范等。最终目的是逐一击破“硬件墙”、“软件墙”、“生态墙”壁垒，充分释放出国产计算体系的综合战力。

很明显，scaleX640就是这一协作模式下的产物，其前景也远非单一厂商主导的超节点产品可比。所以说，国产计算集群的未来必须打破门户之见，因为它的本质是由长下游全栈深度协作而成的动态图景，具备天然的内生动力和可成长性，唯有开放协同才能发挥其真正潜力。

某位业内前辈指出，随着摩尔定律的终结，当前英伟达等国际芯片巨头也开始侧重于“系统极致协同”策略。曙光scaleX640遵循全栈共创的开放式路线，率先引领国产超节点在集群协同效率上完成突破，并且全面兼容主流生态，可以高度对标NV展开新一轮体系化比拼。

“在这场算力规模更大、产业链条更长、系统范围更广的较量中，国产厂商有望进一步强化‘团战能力’，在全球算力产业格局中夺得优势生态位。”圈内对此抱有极大信心。

本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益，请及时联系AG旗舰厅 (中国大陆) 有限公司官网，本站将会在24小时内处理完毕。/74803.html

中国智算破纪录！起底全球最大规模超节点，有何过人之处？

相关推荐