华为超节点技术规模化上线
北京日报

2025-05-17 03:36 语音播报


  本报讯(记者 孙奇茹)在昨天举行的华为云AI峰会上,华为公布其AI基础设施架构的最新进展,其中于近日推出的AI算力新成果CloudMartix 384超节点技术,以384颗昇腾芯片的集群性能,实现比全球业界同类产品领先67%,目前已在芜湖、贵安、内蒙古等多地数据中心规模化上线。
  算力是大模型时代必不可少的战略资源和“燃料”,随着大模型训练和推理对算力需求的爆炸式增长,传统计算架构已难以支撑AI技术的代际跃迁。作为AI算力时代的一种创新技术,超节点通过高速互联技术将成千上万个算力卡连接、整合为一个高效处理大规模任务的超级计算单元。
  据悉,华为CloudMartix 384超节点技术采用创新的全对等互联架构,新型高速互联总线使384张卡互联成为一个超级云服务器,最高能够提供300PFlops(1PFlops代表一秒钟执行一千万亿次浮点运算)的算力规模。华为云副总裁黄瑾介绍该技术可逾越通信效率瓶颈、内存墙制约、可靠性短板三大技术挑战,具备长稳可靠、即开即用等六大技术优势。
  在国产AI算力支撑下,各领域企业的AI应用正加速落地,国产基座模型的持续研发获得充足“燃料”。中国科学院自动化研究所研究员李林静表示,基于CloudMatrix 384超节点的大模型后训练能稳定支撑不同训练范式,为AI模型的迭代升级提供可靠算力保障,有效支持基座模型持续优化。

打开APP阅读全文