2024年,17岁的深圳高中生陈广宇让全世界为之瞩目,也让大家开始思考:这个年纪的天才到底有多厉害?他的成功经验能不能复制?这个问题的答案,或许就藏在他的成长经历里。陈广宇先是通过自学和参与开源项目把基础知识掌握得滚瓜烂熟,然后在技术社区里不停地分享见解。到了2024年,他参加了北京智源人工智能研究院举办的“悟道”大模型黑客松竞赛,因为表现出色,赢得了硅谷一家AI初创公司的实习机会。实习期间,他依然在技术社区里发高质量的文章,最终被月之暗面Kimi团队的人注意到。到了2025年11月,他就以实习生的身份正式加入了Kimi团队。 在这个团队里,陈广宇展示了自己扎实的功底和敏锐的思考。他参与讨论Transformer底层架构的难题,贡献成了“注意力残差”研究的核心部分,还被列为论文的共同第一作者。这个成果很有意义,它让AI学会了“选择性记忆”,把提升大模型能力的路子从堆叠算力转到了提升效率。 陈广宇的成功不是偶然的。他赶上了AI技术平权的黄金窗口期。开源框架降低了门槛,线上社区给了他展示的舞台。月之暗面是中国人工智能公司里的明星企业,他们不拘一格用人才的方式让陈广宇能够探索前沿技术。 现在大家都在讨论怎么复制更多像陈广宇这样的人才。AI时代知识获取很平等了,真正的竞争力在于好奇心和协作精神。要做到这一点,就得构建一个有利于个人发展的多层次生态系统。深圳在创新方面有自己的一套方法:企业出题、院所答题、市场阅卷;鹏城实验室和深圳湾实验室在基础研究和成果转化之间架桥搭路;政府做耐心资本和制度供给者。 陈广宇的故事还告诉我们一个道理:通往基础研究的路可以借助AI技术拓得更宽。教育理念要从传授知识转向问题驱动;评价体系要认可多元能力;城市要做强公共算力平台这些新基础设施;人才筛选要鼓励更多像黑客松这样的平台出现。 埃隆·马斯克把月之暗面Kimi团队的这项成果推到了公众视野里。这项创新是在Transformer架构底层实现的,核心是“注意力残差”,它解决了关键信息被反复稀释的问题。现在主流的大模型都建立在Transformer架构之上,“注意力残差”给大模型能力提升开辟了新路径。这个突破是对AI基础架构的重新思考,也是一项重要的基础创新。 这次成功不仅关乎一个少年的成就,也关乎我们该怎么培养和发现人才。真正的竞争力是人的好奇心和内驱力。深圳在源头技术和底层平台方面取得了不少突破,比如深圳湾实验室就做了很多前沿工作。不一样的眼光才能发现不一样的人才,“黑马”才有机会跃上舞台。