7月28日讯 2025 世界人工智能大会(WAIC)于 7 月 26 日在上海世博中心启幕。本次 WAIC,华为首次线下展出昇腾 384 超节点 Atlas 900 A3 SuperPoD,该产品基于超节点架构,通过总线技术实现 384 个 NPU 之间的大带宽低时延互联,解决集群内计算、存储等各资源之间的通信瓶颈。
据华为中国官方消息,昇腾 384 超节点 Atlas 900 SuperPoD 被评选为本次 WAIC 2025 镇馆之宝,其主要有以下 3 大优势:
① 超大带宽
超节点内任意两个 AI 处理器之间通信带宽,相较于传统架构提升 15 倍,超节点内单跳时延降低 10 倍。
② 超低时延
昇腾超节点支持全局内存统一编址,具备更高效的内存语义通信能力。通过更低时延指令级内存语义通信,可满足大模型训练 / 推理中的小包通信需求,提升专家网络小包数据传输及离散随机访存通信效率。昇腾 384 超节点 Atlas 900 SuperPoD 是业界唯一突破 Decode 时延 15ms 的方案,满足实时深度思考下的用户体验需求。
③超强性能
经过实际测试,在昇腾超节点集群上,LLaMA3 等千亿稠密模型训练性能可达传统集群的 2.5 倍以上。在通信占比更高的 Qwen、DeepSeek 等多模态、MoE 模型上,可以达到 3 倍以上的提升。
