中国工程院院士王坚提到,这次基础模型的发布表明我国交叉学科前沿领域取得了显著的进展,也预示着科学研究正在从经验驱动转向数据驱动加模型驱动的新阶段。为了应对生命科学的困境,科研团队借助华大研究院与之江实验室组建了跨学科攻关团队。在过去的六个月中,他们成功构建了一个包含百亿参数的基因组基础模型,这个模型能够把单碱基突变的功能影响精准识别出来。未来三年里,这个团队计划将模型参数规模扩大到万亿级别。为了解决人类基因组计划完成二十余年来的难题,科研人员发现超过90%的基因组功能还不明确。70%以上的致病位点还需要精确定位,这给精准医疗和疾病预防带来了障碍。地中海贫血症就是一个例子,科学家花了多年时间才找出与南方疟疾流行导致的适应性基因突变的关联。 通过整合不同地域、民族的基因组数据和研发新型算法架构,团队成功构建出了百亿级别的人类基因组基础模型。这种跨学科协同的技术攻坚方式极大提升了科研效率。基础模型不仅能对百万碱基对级别的基因组上下文进行整体分析,还能准确预测临床表型。该技术框架已扩展到材料科学、地球科学等领域,形成了"021"科学基础模型系列。 这个技术的意义不仅在于加速发现单一领域的成果,还在于构建跨学科知识发现的新范式。团队把传统上需要数年时间追踪基因突变与疾病关联的点状突破模式缩短为数周。科学基础模型正在成为支撑多学科发展的新型基础设施。 这次突破展示了我国在交叉学科前沿创新能力和研究方法论革新同频共振的一面。当计算科学与实验科学深度交融时,那些隐藏在亿万碱基对中的生命密码就会在新时代科研范式下被揭开面纱。这为人类健康事业开辟了前所未有的认知疆域。