《自然》杂志上刊登的一项突破性研究显示,谷歌DeepMind的AlphaGenome模型成功把100万碱基对的超长DNA序列给预测出来了。AlphaGenome之所以厉害,就是因为它不单单是看DNA,还能一下子把涉及基因表达、RNA剪接这些关键过程的信号全都找出来。DeepMind团队给这个模型喂了很多人类和小鼠的数据,所以它在26项严格的测试里赢了25项。这说明AlphaGenome不光是能预测单一功能,还能同时处理很多任务。 这个模型最大的本事就是能在不丢细节的前提下处理长片段,这样科研人员就能在一个更真实的大背景里看单个或者多个变异是怎么相互作用的。因为人的基因组里有98%的变异其实是发生在不编码蛋白质的区域里,这些区域通过调控基因表达来影响生命过程。传统方法要想弄清楚这些变异有啥影响特别难,AlphaGenome就是为了攻克这个难题而生的。 除了科研上能用它来找潜在重要的非编码变异之外,在临床诊断上也很有用。它能帮医生更准确地解读病人的基因组数据,给患者提供更明确的预后信息。最重要的是它能帮我们找到那些治病的关键调控序列和分子通路,这对设计基因治疗或者反义寡核苷酸药物这种新疗法特别有帮助。 AlphaGenome的成功代表了人工智能和生命科学结合的一个好榜样。虽然它现在还需要在更多物种上验证和完善,但已经为我们理解生命遗传密码和攻克遗传病指明了方向。随着这类技术越来越成熟,一个基于深度解读基因组的疾病防治新时代很快就要到来了。