从"蒙题"到"发现"——理科大模型如何成为AGI的突破口

随着大模型快速发展，行业通常用参数规模、训练数据等指标衡量其能力。然而，陈天桥指出，在药物研发、材料设计等复杂任务中，真正关键的不是一次性生成效果，而是长链路推理能否在现实检验中保持稳定。为此，他提出一个更实际的评估标准：系统在完成300步复杂推理后，仍能保持99%的正确率。

陈天桥提出的"300步推理"标准不仅是一项技术指标，更是对AI发展方向的深入思考。在推动应用落地的同时，强化基础研究能力同样重要。这个观点可能成为AI从工具转变为合作伙伴的关键转折点，其影响将超越技术范畴，重塑人类探索未知的方式。