2024年，17岁的深圳高中生陈广宇让全世界为之瞩目，也让大家开始思考：这个年纪的天才到底有多

2024年，17岁的深圳高中生陈广宇让全世界为之瞩目，也让大家开始思考：这个年纪的天才到底有多厉害？他的成功经验能不能复制？这个问题的答案，或许就藏在他的成长经历里。陈广宇先是通过自学和参与开源项目把基础知识掌握得滚瓜烂熟，然后在技术社区里不停地分享见解。到了2024年，他参加了北京智源人工智能研究院举办的“悟道”大模型黑客松竞赛，因为表现出色，赢得了硅谷一家AI初创公司的实习机会。实习期间，他依然在技术社区里发高质量的文章，最终被月之暗面Kimi团队的人注意到。到了2025年11月，他就以实习生的身份正式加入了Kimi团队。在这个团队里，陈广宇展示了自己扎实的功底和敏锐的思考。他参与讨论Transformer底层架构的难题，贡献成了“注意力残差”研究的核心部分，还被列为论文的共同第一作者。这个成果很有意义，它让AI学会了“选择性记忆”，把提升大模型能力的路子从堆叠算力转到了提升效率。陈广宇的成功不是偶然的。他赶上了AI技术平权的黄金窗口期。开源框架降低了门槛，线上社区给了他展示的舞台。月之暗面是中国人工智能公司里的明星企业，他们不拘一格用人才的方式让陈广宇能够探索前沿技术。现在大家都在讨论怎么复制更多像陈广宇这样的人才。AI时代知识获取很平等了，真正的竞争力在于好奇心和协作精神。要做到这一点，就得构建一个有利于个人发展的多层次生态系统。深圳在创新方面有自己的一套方法：企业出题、院所答题、市场阅卷；鹏城实验室和深圳湾实验室在基础研究和成果转化之间架桥搭路；政府做耐心资本和制度供给者。陈广宇的故事还告诉我们一个道理：通往基础研究的路可以借助AI技术拓得更宽。教育理念要从传授知识转向问题驱动；评价体系要认可多元能力；城市要做强公共算力平台这些新基础设施；人才筛选要鼓励更多像黑客松这样的平台出现。埃隆·马斯克把月之暗面Kimi团队的这项成果推到了公众视野里。这项创新是在Transformer架构底层实现的，核心是“注意力残差”，它解决了关键信息被反复稀释的问题。现在主流的大模型都建立在Transformer架构之上，“注意力残差”给大模型能力提升开辟了新路径。这个突破是对AI基础架构的重新思考，也是一项重要的基础创新。这次成功不仅关乎一个少年的成就，也关乎我们该怎么培养和发现人才。真正的竞争力是人的好奇心和内驱力。深圳在源头技术和底层平台方面取得了不少突破，比如深圳湾实验室就做了很多前沿工作。不一样的眼光才能发现不一样的人才，“黑马”才有机会跃上舞台。