当前,国产大模型产业正处于快速迭代的关键阶段。2月中旬,MiniMax、智谱、字节跳动等多家头部企业短时间内集中发布新产品,这种现象背后反映出行业竞争的白热化程度。业界将此时期的竞争态势形象地称为"诸神之战",足以说明市场竞争的激烈程度。 从技术进展看,各企业推出的新产品在多个维度实现了突破。MiniMax发布的M2.5模型在编程能力上表现突出,权威基准测试SWE-Bench Verified中得分达80.2%,较上一代提升。该模型表现出"原生Spec能力",能够在编码前主动拆解架构与功能规划,更贴近实际工程师的工作流程。在工具调用和搜索能力上,M2.5相比上一代提升20%,达到行业顶尖水平。 智谱推出的GLM-5模型则基础能力上实现了量级提升。该模型基座参数从355B扩展至744B,预训练数据从23T提升至28.5T。在编程能力上实现与Claude Opus 4.5对齐,在SWE-bench-Verified和Terminal Bench 2.0等主流基准测试中获得开源模型最高分数,性能超过Gemini 3 Pro。 推理速度与成本控制成为新一轮竞争的重要指标。M2.5-lightning版本支持每秒100 Token以上的输出速度,是主流模型的两倍左右。在成本上,输入价格约0.3美元/百万Token,输出约2.4美元/百万Token。按照每秒输出100 Token计算,连续运行一小时的成本仅约1美元。这意味着1万美元理论上可支持4个Agent连续工作一年,大幅降低了企业应用成本。 字节跳动旗下的Sora视频生成模型Seedance 2.0则多模态应用领域展现出强大能力。该模型支持多模态输入,能够生成电影级视频,引发全球关注。这一进展表明,国产大模型在应用创新上已与国际先进水平相当。 从产业生态看,新产品的推出正加速应用场景的拓展。MiniMax在发布M2.5后不到一天,全球用户已在其平台上构建超过1万个专家应用,且仍在快速增长。这反映出市场对高效、低成本大模型的迫切需求,也预示着Agent应用将从编程、办公等专业领域逐步渗透到创作、娱乐等更广泛的生活场景。 资本市场的反应印证了投资者对产业前景的看好。2月12日,智谱股价大幅上涨28.68%,创下历史新高,总市值达1792亿港元,单日增加400亿港元。MiniMax开盘报642港元,涨超9%,年内涨幅超56%。这种资本热度既反映了市场对技术进步的认可,也表明大模型产业正处于商业化加速阶段。 从更深层看,国产大模型集中发力的背后是产业发展的必然逻辑。一上,技术积累到一定阶段后,各企业都具备了推出新产品的能力;另一方面,春节前夕是传统的营销窗口期,企业倾向于在此时发布重磅产品以获得最大关注度。同时,国际竞争压力也推动了国内企业加快创新步伐。
节前的新品潮看似是产品发布的"速度赛",实则是大模型产业转向规模化应用的"耐力赛";随着技术差距缩小,决定未来发展的关键将不仅是参数指标,更在于成本控制、可靠性、合规性和生态协同等综合能力。将"可用、可控、可持续"落实到具体场景中,才是国产大模型高质量发展的核心所在。