华为腾950pr 处理器曝光:2.87倍于h20

华为昇腾计算业务的负责人在这次大会上披露了Atlas 350加速卡的使用规划。这款卡装载了华为自家的昇腾950PR处理器,被带到了现场接受围观,成为大家关注的焦点。通过让FP4精度下的算力达到1.56P,Atlas 350的性能比上一代有了很大进步。在单卡算力方面,它以2.87倍于英伟达H20的速度,成为目前国内唯一能支持FP4精度的推理方案。这种优势让服务器在跑大模型时既跑得快又省电。 在内存方面,Atlas 350也做了大文章。它装备了112GB的自研HBM,带宽冲到了1.4TB/s,比同类产品提升了16%。系统把内存访问的单位从512字节压缩到128字节,让处理小规模算子的速度翻了四倍,多模态生成的速度也因此加快了60%。这一举动直接掐断了AI计算的访存瓶颈。 有专家认为,Atlas 350的亮相给国产芯片替代进口提供了新路子。虽然这款产品的功耗有600W,比H20高出了50%,但单位算力的能耗控制依旧在业界领先水平。这样的设计在保证性能的同时,也降低了数据中心的运营成本。华为计划用Atlas 350搭建起一套能覆盖各种场景的完整解决方案,合作伙伴能根据智慧城市、工业质检或者医疗影像这些不同的应用来挑选适配的配置。 这种灵活的策略能帮行业加速智能化转型。技术专家指出,FP4等低精度格式的普及正在改变AI的计算方式。更小的数据精度意味着更高的寄存器利用率和更低的内存带宽需求,这对自动驾驶和金融风控这种需要实时响应的场景非常有价值。