昇腾950PR助力Atlas 350加速卡商用落地 国产推理算力实现规模化应用

随着人工智能技术快速演进,算力需求持续攀升,高性能AI芯片的自主研发正成为推动行业智能化的重要支点。基于此,华为昇腾计算业务推出全新Atlas 350加速卡,搭载昇腾950PR处理器,显示国产AI芯片能力深入提升。 技术突破显著 Atlas 350采用SIMD架构设计,FP4精度算力达1.56P,互联带宽高达1.4TB/s,内存容量提升至128GB。与英伟达H20芯片相比,其HBM容量增加16%,多模态生成速度提升60%,小算子访存效率提高4倍。尽管功耗略高,但单卡算力达到H20的2.87倍,并成为国内首款支持FP4低精度的推理产品。 应用场景广泛 在实际测试中,Atlas 350在互联网推荐、短视频、电商等高并发场景中表现稳定,时延更低、响应更快。同时,在大模型推理、文生图、文生视频等多模态任务中,其表现可对标国际主流产品。华为表示,昇腾将围绕大、中、小三类核心算力场景进行布局,以覆盖不同行业需求。 生态合作加速落地 大会期间,昆仑、华鲲振宇等七家核心厂商发布了基于Atlas 350的服务器整机产品。其中,软通动力推出的“超强A860 A5”AI服务器支持8块Atlas 350加速卡,面向大语言模型训练等高算力需求场景。科大讯飞也宣布,新一代星火大模型将与昇腾算力底座深度适配,以提升AI解决方案的整体能力。 行业解决方案全面覆盖 华为联合20家头部企业发布2026昇腾AI应用场景解决方案,覆盖辅助办公、电子病历、智能客服等领域。对应的方案强调轻量部署与快速上线,针对行业智能化落地中部署复杂、周期较长等问题提供路径。目前,昇腾已与合作伙伴推出400多款行业一体机,服务客户超过2700家,在国内一体机市场占据约八成份额。

从推理加速卡迭代到伙伴整机集中发布——再到面向多行业的方案集成——产业正把“算力供给”深化为“可落地能力”。在大模型走向规模应用的关键阶段,能否以更高效率、更可控成本和更快交付支撑业务闭环,将直接影响企业在新一轮智能化竞争中的位置。下一步,技术演进与生态协作仍需同步推进,让算力更快转化为生产力。