加州大学旧金山分校：决定学习效率的不是重复的次数，而是奖励之间等待的时间

曾有一个被当作金科玉律的观点：只有重复才能让人学会东西。可是这个观点，在2026年2月被推翻了。加州大学旧金山分校（UCSF）的维杰·莫汉·南布迪里团队在一本很有名的杂志《自然·神经科学》上发表了一项新发现。他们认为，决定学习效率的不是重复的次数，而是奖励之间等待的时间。这个研究结果虽然简单，但是让人有点不安。实验过程也不是很复杂，团队找来101只口渴的小鼠，用声音和糖水来训练它们。关键是把两次奖励之间的间隔时间变一下。有一组小鼠每60秒就能得到糖水，而另一组要等600秒。按以前的想法，前一组应该学得快，但结果相反。间隔600秒的小鼠只需要十分之一左右的次数就能建立起联系。南布迪里接受采访时说：“学习真的不是靠练习多少次，而是时机决定一切。” 科学家用一种技术追踪小鼠大脑里的多巴胺释放情况。多巴胺是和学习还有奖励有关的一种物质。结果显示，大脑很早就学会在听到声音时就释放多巴胺，这个变化甚至比小鼠舔舐糖水还要早出现。科学家还做了几个对照实验来验证这个发现。比如测试每天得到奖励总量减少是否影响学习速度，或者在实验室待久了会不会有别的作用。结果发现这些因素都不影响学习速度，只有奖励之间的时间间隔才是关键。他们把实验扩展到厌恶学习领域，用声音配合轻微电击替代糖水。结果还是一样：电击间隔越长，小鼠建立恐惧关联所需的试验次数越少。这说明这个规律不仅适用于奖励也适用于惩罚。研究团队还进行了部分强化实验：音调播放间隔保持在60秒，但只有10%到50%的时间里给予糖水。结果显示即使不给奖励时多巴胺反应依然提前出现并趋于稳定。这个发现让人们对成瘾行为有了新理解：尼古丁依赖就是通过环境线索与间歇性、不规律的奖励反复配对实现的。南布迪里团队推测尼古丁贴片有效的原因之一可能就是它打断了特定环境线索与奖励之间的配对节律。这项研究还给人工智能领域带来启示：现在很多强化学习系统依赖海量交互来积累参数更新。如果能把时间间隔规律引入AI学习算法设计中，理论上可以让模型从更少样本中提取更多信息。当然这个研究还有局限：实验都在小鼠身上完成，人类的学习情境复杂得多。还有极端间隔条件下规律可能失效。最后南布迪里指出：“你练了多少次并不是大脑真正在乎的事情。”