glm-5的大模型，摩尔线程给mtt s5000 gpu装了glm-5的程序

其实是今天2月11日，智谱才刚发布了 GLM-5 这个大模型，摩尔线程公司为了跟上这个节奏，就在MUSA架构上给MTT S5000 GPU 装了 GLM-5 的程序，也就是实现了全流程适配与验证。为了让这个大模型在 S5000 上跑起来，他们用了 SGLang 推理框架来帮忙。这么做是因为这张 GPU 有80GB显存和1.6TB/s带宽，正好能给AI运算提供强有力的支持。这张卡是第四代MUSA架构打造的，单卡AI算力最高可以达到1000 TFLOPS。这次的Day-0适配还把S5000的FP8加速能力给释放出来了，不仅降低了显存占用，推理性能也提升了20%。这个大模型主要是为了代码开发设计的，也有Agentic Engineering能力，能处理复杂系统工程任务。除了FP8以外，这张卡还支持FP64等全精度计算呢。