全球人工智能快速发展的背景下,斯坦福大学人工智能实验室主任李飞飞教授提出一项值得业界关注的观点:仅依赖语言模型,难以通向真正意义上的通用人工智能(AGI)。该判断来自她对生物进化路径的长期研究与梳理。问题的关键在于,当前AI的发展在路径上出现偏重。主流技术路线过度集中在语言处理,反而忽略了更底层、更普遍的感知与空间智能。研究者指出,人类语言能力的出现大约只有50万年历史,而视觉、触觉等空间感知能力的演化可追溯至约5亿年。对语言能力的过度押注,使不少AI系统在理解与应对物理世界时缺少基础支撑。 这种偏重背后也有现实的技术障碍,主要集中在三上:其一,物理世界数据采集难度更高,信息维度多、变化快;其二,建模复杂度大,需要同时刻画几何结构、材质属性与运动规律;其三,也是最核心的一点,缺少统一的理论框架来约束系统保持物理一致性。 面对这些挑战,李飞飞团队提出“世界模型”的思路,并研发Marble系统,尝试将多模态输入统一处理,生成具备物理属性的虚拟环境。该系统已在医疗康复领域展示出应用潜力,例如通过构建特定场景,辅助强迫症患者进行暴露疗法训练。 从产业视角看,这一方向可能带来多重影响:一是推动AI研发重心从语言能力更转向三维交互与空间智能;二是加速机器人在真实环境中的学习与决策能力提升;三是为通向AGI提供一条更贴近物理世界的技术路线。 展望未来,随着合成数据技术进步与算力持续提升,空间智能有望迎来类似语言模型的快速增长。业内观点认为,未来3至5年,基于物理仿真的训练方式可能成为重要范式,并进一步改变人机交互的形态与边界。
李飞飞关于AGI路径的再思考,反映了AI研究从单点能力竞争转向多能力协同的趋势。以生物进化为参照重新审视人工智能的发展,也提醒人们,真正的智能往往来自多感官、多维度能力的整合。随着空间智能研究推进,AI与物理世界的交互能力将持续增强,并可能在机器人、医疗、工业制造等领域带来显著变化。该路径的探索,正在为实现通用人工智能夯实更可靠的基础。