9月19日,在华为全连接大会2025主题演讲环节,华为常务董事、华为云计算CEO张平安围绕“全面智能化,成就行业AI先锋”,分享了华为云在AI云服务、大模型、具身智能、AI Agent等领域的技术创新与落地实践。华为高级副总裁、华为云全球Marketing与销售服务总裁杨友桂分享了数智化时代下,华为云帮助企业实现全球业务成功的创新技术和经验思考。
超节点可实现百万卡超大集群
华为云CloudMatrix384昇腾AI云服务已全面上线。未来华为CloudMatrix超节点规格将从384卡升级到8192卡,可实现50-100万卡的超大集群。华为云首创EMS弹性内存存储服务,用内存扩展显存,显著降低大模型多轮对话时延,大幅提升模型使用体验。
随着AI算力需求的暴增,传统的数据中心已不适合构建高效的AI基础设施,单机柜功率要从10千瓦/每柜,升级到70千瓦/每柜,甚至是200千瓦/每柜,要从风冷转变到全液冷。华为云在贵州、内蒙古、安徽部署了全液冷AI数据中心,实现单机柜80千瓦散热,PUE低至1.1,并能够实现AI智能运维。企业无需改造或新建传统数据中心,通过一对光纤,就能获取华为云上高效的AI算力,也可以获得全栈专属AI云服务。
张平安指出,Token服务可以有效屏蔽复杂的底层技术,直接为用户提供最终的AI计算结果,是最高效的推理算力使用方式。CloudMatrix384超节点将算力、内存、显存等资源全面池化,把计算型任务、存储型任务、AI专家系统解耦,将串行任务变成分布式并行任务,极大地提升了系统的推理性能。在在线、近线和离线等不同时延推理场景中