从"蒙题"到"发现"——理科大模型如何成为AGI的突破口

随着大模型快速发展,行业通常用参数规模、训练数据等指标衡量其能力。然而,陈天桥指出,在药物研发、材料设计等复杂任务中,真正关键的不是一次性生成效果,而是长链路推理能否在现实检验中保持稳定。为此,他提出一个更实际的评估标准:系统在完成300步复杂推理后,仍能保持99%的正确率。

陈天桥提出的"300步推理"标准不仅是一项技术指标,更是对AI发展方向的深入思考。在推动应用落地的同时,强化基础研究能力同样重要。这个观点可能成为AI从工具转变为合作伙伴的关键转折点,其影响将超越技术范畴,重塑人类探索未知的方式。