林俊旸离职后聚焦大模型演进：从推理思考到智能体思考的转变

人工智能技术发展正处在关键转折点。曾任阿里巴巴大模型团队技术负责人的林俊旸近日公开发布技术分析文章，引发业内关注。这也是他离职后首次较为系统地阐述对行业趋势的判断，为当前大模型技术路线提供了新的观察角度。林俊旸在文中指出，行业的评估标准正在发生根本变化。过去两年，OpenAI的o1模型、DeepSeek-R1等关键进展表明，“思考”能力可以通过专门化训练实现，并具备规模化落地的可能。这推动行业重心从预训练转向强化学习等后训练环节，数学、代码等可验证领域成为提升模型准确性的主要抓手。更来看，行业也在遭遇新的瓶颈。到2025年上半年，多数团队仍将主要投入在“推理式思考”上，但该范式已显露边界。林俊旸提出“智能体式思考”的概念，强调“为行动而思考”，试图为当前困境提供新的路径。在这一模式下，模型需要能基于环境反馈更新计划、修正行为，与现实世界形成闭环交互。值得关注的是，林俊旸也在文章中直接复盘了探索中的得失。阿里团队曾在2025年初尝试构建融合“思考”与“指令”模式的统一系统，Qwen3项目即是这一理念的具体尝试。但实践显示，两种模式在数据分布与目标函数上存在内在冲突，强行合并使模型表现趋于平淡。这一案例为行业提供了可借鉴的教训。围绕如何走出困境，林俊旸给出了更明确的技术方向。他认为，所谓“融合”不应是简单拼接，而应构建“推理力度光谱”，让模型能够按任务需要自主分配算力资源。这也指向行业常见误区：过度追求推理链长度，却忽视实际收益。林俊旸指出，过长的推理链往往带来算力浪费，行业需要从“训练模型”转向“训练智能体”。从更长周期看，竞争格局也可能随之变化。随着智能体式思考走向主流，环境设计与对应的基础设施将成为新的核心能力。林俊旸特别提到，如何防范“奖励作弊”会成为关键挑战，要求在系统设计层面实现新的突破。就在林俊旸文章发布不久，阿里巴巴集团宣布成立Alibaba Token Hub事业群，由集团CEO吴泳铭直接领导。此项调整与林俊旸对下一代AI基础设施的判断形成呼应，也显示头部企业已开始提前布局。

林俊旸的观点具有较强参考价值：一方面梳理了大模型技术可能转向的新路径，另一方面以坦诚的失败复盘为行业提供了可复用的经验。从追求单一模型能力的极限，到搭建模型与环境交互的完整系统，这个转变反映了对人工智能落地方式的重新认识。当业界关注点从“能否想得更久”转向“能否支撑有效行动”，大模型的应用也将更快从概念走向实用。在这一过程中，能否真正理解并把握智能体式思考的关键机制，或将决定下一轮竞争的主动权。环境设计、基础设施建设等看似“幕后”的能力，也可能逐步成为影响AI应用成败的核心因素。