原阿里千问技术负责人林俊旸：智能体式思考才是未来

3月4日凌晨，林俊旸在朋友圈发文告别了阿里，说要卸任了，向亲爱的qwen道别。到了3月5日，阿里巴巴CEO吴泳铭给内部发邮件回应了此事，批准了他的辞职请求，还感谢了他在岗位上的付出。同时，公司表示要继续坚持开源模型策略，加大AI研发投入和吸纳优秀人才的力度。快科技3月27日消息，3月26日晚间，原阿里千问技术负责人林俊旸发布了一篇长文。文章名字叫《From "Reasoning" Thinking to "Agentic" Thinking》。林俊旸在这篇文章里没有谈自己的职业规划，而是聊了自己对大模型发展路线的理解，还预测了AI的下一阶段。他提到过去两年重塑了行业对大模型的评估方式和核心期待。OpenAI的o1表明，“思考”可以被训练出来。DeepSeek-R1紧随其后，证明推理式的后训练能在实验室之外复现和扩展。这个阶段很重要。 2025年上半年，行业焦点主要是“推理式思考”本身，大家都想让模型在推理的时候多想一想。现在该考虑下一步了。他觉得智能体式思考才是未来，为了行动而思考，和环境交互并根据反馈调整计划。2025年初，千问团队想做一个统一系统，把思考和指令模式合二为一，支持不同推理力度，甚至根据上下文自动决定推理量。他说这方向没错，但合并起来很难。合并起来容易说难做好。关键问题在于数据。合并思考和指令时，大家往往只考虑模型兼容性，但两种模式的数据分布和目标差异很大。团队在尝试平衡时没全做好，结果两个方向都表现一般：思考行为太嘈杂、指令不够清晰可靠、成本还高。其实分开做在实践中还不错。2025年下半年Qwen 2507版发布了独立的Instruct和Thinking版本。他的最终想法是成功合并需要平滑的推理力度光谱，模型能自己判断该花多少力气。“推理链长不一定聪明。”他在文中说。随即他提到千问团队意识到行业正在从训练模型走向训练智能体时代。智能体思维和推理思维优化目标不同。前者看内部思辨质量，后者看能否在交互中持续进步。问题从“能不能想够久”变成“能不能支撑行动”。核心对象变成整个系统（模型加环境）。环境设计、基础设施、评估器这些都进了核心圈。他预测智能体式思考会成为主流。