-
工作日:8:00 — 17:20
销售:宋经理
7月26日-28日,,全球顶级的AI大会世界人工智能大会(WAIC 2025)在上海召开,,,为全球产业变革提供关键技术支点与战略前瞻洞察。。。作为人工智能产业链重要一环,,,,本届WAIC也聚集了本土一众算力芯片厂商,,,其中,,,,华为384超节点真机首次线下亮相引发了广泛的关注。。此外,,摩尔线程、、沐曦、、、、燧原、、曦智科技等都展出了自己最新的产品和解决方案。。
澎湃新闻记者观察到,,在算力芯片制程受限的情况下,,,产业界转向超节点集群以及产业链多个环节协同创新方式来解决当下算力需求。。特别值得一提的是,,算力前沿领域的光互联光交换技术也取得了一系列突破性进展。。。。
2025年7月26日,,,,上海世博展览馆,,华为昇腾超节点技术突破384卡高速互联,,,,通信带宽提升15倍,,,,使千亿级模型性能提升2.5倍以上。。。。澎湃新闻记者 朱伟辉 图
厂商齐推超节点推动算力进入“万卡协同”时代
本次大会,,华为首次把384超节点真机搬到展台,,从而引发了观众广泛关注。。。
华为超节点首创将384颗昇腾NPU和192颗鲲鹏CPU通过全新高速网络MatrixLink全对等互联,,,形成一台超级“AI服务器”,,,,算力规模300 PFlops,,成功打破跨机通信带宽性能瓶颈,,,,实现从服务器级到矩阵级的资源供给模式转变。。。。
此外,,,,华为云的昇腾AI云服务,,,,让超节点能够以云服务的形态实现按需用、、随心用,,,降低企业应用先进智算基础设施的门槛,,,,目前基于CloudMatrix 384超节点的华为云新一代昇腾AI云服务目前已在芜湖、、、、贵安、、、乌兰察布、、和林格尔数据中心全面上线。。。。
万亿参数大模型与多模态训练的崛起,,,,正推动算力集群迈入“万卡协同”时代。。超节点架构通过深度整合GPU资源,,在超节点内构建起低延迟、、、、高带宽的统一算力实体,,已成为支撑这一演进的关键技术路径。。。
一位芯片行业人士接受澎湃新闻记者采访时表示,,之前英伟达推出了NVL 72方案,,,专注为万亿参数大模型提供训练算力,,,这也是行业的共识,,,,大家都会走超节点集群路线。。。此外,,本土芯片制程受限,,,单芯片突破比较难,,超节点把更多卡放在一起,,,从而满足高参数大模型训练需求。。。
同样的,,,,摩尔线程在WAIC上首次提出“AI工厂”理念,,从单芯片转向系统级创新来突破大模型训练效率瓶颈。。。
摩尔线程提出的“AI工厂”,,,,如同芯片晶圆厂的制程升级,,,,是一个系统性、、、全方位的变革,,,,需要实现从底层芯片架构创新、、、、到集群整体架构的优化,,,再到软件算法调优和资源调度系统的全面升级。。。这种全方位的基础设施变革,,,,将推动AI训练从千卡级向万卡级乃至十万卡级规模演进,,,以系统级工程实现生产力和创新效率的飞跃。。。。
“光”迎来了高光时刻
本届WAIC,,,,曦智科技联合壁仞科技、、、中兴通讯共同推出的光跃LightSphere X——全球首个分布式光互连光交换GPU超节点解决方案,,,凭借其突破性原始创新获得了大会2025 SAIL奖(卓越人工智能引领者奖)。。。。
需要指出的是这是一个真实落地的算力方案,,,即将落地在上海仪电的国产算力集群。。。
曦智科技的“全光”方案为厂商部署超节点方案提供了新思路。。。。大型计算集群成千上万颗GPU一起协同工作,,连接他们的“神经”——传统的电缆在长距离传输高带宽信号时,,,会产生巨大的延迟和功耗,,这限制了集群的规模和效率。。。
这时,,人们目光锁定了“光”,,,光带宽更高、、、、延迟更低、、、能耗也更小。。。。英伟达在交换机上率先引入了CPO(光电共封装)技术,,把光模块和交换芯片封装在一起,,缩短了电信号的传输距离,,,从而降低了衰减和功耗。。。曦智科技也是一家追“光”者,,,,专注于“光子计算+光子网络”两大领域。。。
该超节点的核心技术就是曦智科技全球首创的分布式光交换技术。。。传统的方式无论电交换还是光交换都是中央集中式交换,,而LightSphere X分布式交换可以理解为把集中式打成碎片,,让每个GPU上集成光交换功能。。。这让超节点在调度GPU时变得非常灵活,,,,而且可以实现故障场景下替换替补,,,降低GPU冗余成本。。
更关键的是,,这种交换方式发生在物理层,,,与上层的数据传输协议无关。。。。这也使得国内各大GPU厂商都愿意跟曦智科技合作一起来构建解决方案。。。。
除了分布式超节点方案,,曦智科技还联合燧原科技推出国内首款xPU-CPO光电共封装原型系统,,,,通过将光学引擎与计算芯片(xPU)在基板上实现光电共封装,,大幅提升信号完整性并降低损耗和延迟,,,同时显著降低系统功耗,,,,有效提高光电转换的稳定性。。
国内首款xPU-CPO光电共封装原型系统
作为国内首次采用CPO技术实现GPU直接出光的成功案例,,,,该项目验证了xPU-CPO光电共封装技术的可行性与技术方向,,同时为中国人工智能基础设施建设与先进光学封装产业突破奠定了关键技术锚点。。。。
曦智科技还与沐曦合作的光互连电交换超节点方案也首次公开亮相。。。。该方案采用线性直驱光互连技术,,,,具有低延时、、、高带宽、、、低功耗的特点,,,并支持长距离传输,,,,突破跨机柜连接的限制,,,,支持8台标准服务器共64张xPU卡的高速互连,,,,为大模型训练及推理提供更灵活、、、更高效的并行策略支持,,,从而提升集群性能。。
曦智科技创始人、、、、CEO沈亦晨表示:“我们的芯片制程上不一样,,,我们没有办法继续去复制美国的技术路线,,,但我们在互联上会催生革命性的’交通工具’。。光互联是轨道交通,,电互联是公路交通。。”
“我们在硅光技术上不落后,,,甚至我们商业落地比美国企业还要领先些。。。”沈亦晨表示,,,未来可能每个交换芯片、、GPU芯片都会配数个硅光芯片,,类似现在GPU边上配了一圈HBM,,,整个硅光的生态产业链都会受益,,包括晶圆厂、、光的封装厂,,激光的光源,,,,激光芯片公司等。。。