行业内的大佬们最近聚在一起,聊了聊人工智能未来的发展方向。中国在AGI(通用人工智能)这个领域,探索的路子挺多,挺丰富。全球人工智能大潮席卷而来,中国在这块儿怎么走、怎么想,大伙儿都盯着看呢。前阵子,清华大学基础模型北京市重点实验室跟几家公司联手办了个AGI前沿闭门研讨会。这儿头来了不少国内搞AGI的核心团队领头人。大家伙儿坐一块儿深聊,能看出咱们现在追求AGI的最新想法、碰到的难处,还有多元化的战略布局。 会上的嘉宾有智谱AI的创始人唐杰,月之暗面的杨植麟,还有阿里和腾讯那边的负责人。这些人有的是学术派的先锋,有的是刚冒头的独角兽,也有互联网的大厂代表。他们的观点碰在一起,多少能画出中国AGI发展的那张大生态图。 虽说咱们国家这些年在搞大模型、落地应用上步子迈得挺快,尤其是靠开源生态在国际上攒下了不少名气,但大家心里都明白着呢。唐杰就说,咱们得客观地看中美在人工智能基础模型这块的差距。他提个醒,美国那边有好多闭源的模型没拿出来晒,光看咱们开源的进度去判断技术差距可不对。这也告诉咱们,在夸自己进步的同时,还得盯着底层核心技术创新、突破技术壁垒这事上使劲儿,这可是学界和产业界得长期坚持干的活。 说到接下来AGI该往哪儿走,专家们看法挺不一样的。这说明中国的AGI探索早就过了刚开始的追赶期,现在是根据自己的判断走上不同路子了。唐杰觉得DeepSeek模型出现以后,光靠对话(Chat)这块的探索已经差不多了。他说智谱AI现在把研发重点放在了编码(Coding)和推理(Reasoning)能力怎么深度融合上,最近放出来的GLM-4.5模型就是这么搞的,想把推理、智能体(Agentic)和编码能力捏一块儿。 杨植麟倒是觉得扩展定律(Scaling Law)还是挺重要的。不过他对“扩展”的理解跟以前不太一样了。他说下一轮的扩展不光是堆算力资源,还得在模型架构、优化器设计还有数据质量这些关键技术上搞革新。最终目标是把模型的“品味”(Taste)提上去,让它有多样化的高级表现,别老是一个样。 技术路子多了以后怎么科学评模子的水平成了新难题。大家普遍觉得得把以前那种测试基准的老规矩改改。杨植麟提了个结合“令牌效率”(Token Efficiency)和“长上下文”(Long Context)的办法,看看模型在不同长度文本下的表现咋样。唐杰又提了个“智力效率”(Intelligence Efficiency)的概念,就是算一算模型产出智力跟投入资源之间的回报率(ROI),这也是想着让技术发展可持续点。 为啥要选不同的技术路子呢?其实这背后是因为大家对AGI最后要干嘛的看法不太一样:有人想把智力水平冲到顶儿上,有人想实实在在地解决实际产业里的问题。来自大互联网公司的专家们就分享了不少实战经验。林俊旸和姚顺雨都觉得以后面向消费者的To C和面向企业的To B发展路径会越来越不一样。 姚顺雨说在To C那边,模型跟产品得贴得紧紧的、垂直整合在一起、一块迭代打磨才能让用户觉得好用。但在To B那边逻辑可能反过来了:专业做模型的公司要把基础模型能力做得强而又强通用;而各行各业的应用开发者呢,就拿这些强大的模型当底座,再加上自己行业的知识去搞能提升生产力的解决方案。这就意味着以后产业可能会出现分层协作的局面。 这次高端研讨会虽然是闭门的交流会发出的信号很强硬:中国AI圈特别是AGI这块儿现在呈现出的局面很热闹——好多不同的主体一块儿在干,好几种技术路线在较劲,学术圈和产业界深度互动得火热。从正视自己的差距开始,再去定义新的技术范式和评价标准,最后把技术发展跟实际需求绑一块儿看——这说明中国的AGI研发正变得越来越成熟、务实了。 前路肯定还会有很多挑战等着咱们,但这种持续创新的劲头还有对产业融合的深刻理解正在给中国在全球AI历史上写下独特篇章攒足劲儿呢。到底能不能把这些技术突破真变成普遍的生产力提升和社会福利的提高——这就是衡量咱们这场大事业到底值不值的重要标准。