昇腾950PR助力Atlas 350加速卡商用落地国产推理算力实现规模化应用

随着人工智能技术快速演进，算力需求持续攀升，高性能AI芯片的自主研发正成为推动行业智能化的重要支点。基于此，华为昇腾计算业务推出全新Atlas 350加速卡，搭载昇腾950PR处理器，显示国产AI芯片能力深入提升。技术突破显著 Atlas 350采用SIMD架构设计，FP4精度算力达1.56P，互联带宽高达1.4TB/s，内存容量提升至128GB。与英伟达H20芯片相比，其HBM容量增加16%，多模态生成速度提升60%，小算子访存效率提高4倍。尽管功耗略高，但单卡算力达到H20的2.87倍，并成为国内首款支持FP4低精度的推理产品。应用场景广泛在实际测试中，Atlas 350在互联网推荐、短视频、电商等高并发场景中表现稳定，时延更低、响应更快。同时，在大模型推理、文生图、文生视频等多模态任务中，其表现可对标国际主流产品。华为表示，昇腾将围绕大、中、小三类核心算力场景进行布局，以覆盖不同行业需求。生态合作加速落地大会期间，昆仑、华鲲振宇等七家核心厂商发布了基于Atlas 350的服务器整机产品。其中，软通动力推出的“超强A860 A5”AI服务器支持8块Atlas 350加速卡，面向大语言模型训练等高算力需求场景。科大讯飞也宣布，新一代星火大模型将与昇腾算力底座深度适配，以提升AI解决方案的整体能力。行业解决方案全面覆盖华为联合20家头部企业发布2026昇腾AI应用场景解决方案，覆盖辅助办公、电子病历、智能客服等领域。对应的方案强调轻量部署与快速上线，针对行业智能化落地中部署复杂、周期较长等问题提供路径。目前，昇腾已与合作伙伴推出400多款行业一体机，服务客户超过2700家，在国内一体机市场占据约八成份额。

从推理加速卡迭代到伙伴整机集中发布——再到面向多行业的方案集成——产业正把“算力供给”深化为“可落地能力”。在大模型走向规模应用的关键阶段，能否以更高效率、更可控成本和更快交付支撑业务闭环，将直接影响企业在新一轮智能化竞争中的位置。下一步，技术演进与生态协作仍需同步推进，让算力更快转化为生产力。

昇腾950PR助力Atlas 350加速卡商用落地 国产推理算力实现规模化应用

昇腾950PR助力Atlas 350加速卡商用落地国产推理算力实现规模化应用