其实是今天2月11日,智谱才刚发布了 GLM-5 这个大模型,摩尔线程公司为了跟上这个节奏,就在MUSA架构上给MTT S5000 GPU 装了 GLM-5 的程序,也就是实现了全流程适配与验证。为了让这个大模型在 S5000 上跑起来,他们用了 SGLang 推理框架来帮忙。这么做是因为这张 GPU 有80GB显存和1.6TB/s带宽,正好能给AI运算提供强有力的支持。这张卡是第四代MUSA架构打造的,单卡AI算力最高可以达到1000 TFLOPS。这次的Day-0适配还把S5000的FP8加速能力给释放出来了,不仅降低了显存占用,推理性能也提升了20%。这个大模型主要是为了代码开发设计的,也有Agentic Engineering能力,能处理复杂系统工程任务。除了FP8以外,这张卡还支持FP64等全精度计算呢。