中新网北京1月30日电,据《自然》杂志报道,谷歌团队开发了一种名叫AlphaGenome的深度学习模型,专门用来搞懂DNA序列的功能,能一口气处理长达100万碱基对的庞大数据。施普林格·自然和孙自法都对这次研究给予了肯定。谷歌DeepMind团队展示了这个模型的威力,用人类和小鼠的基因组把它喂熟,好让它学会DNA变化是怎么搅乱各种生物过程的。 要给这个工具打分的话,它能把不同遗传信号和生物结果一股脑儿算出来。它一口气预测了5930种人类信号或者1128种小鼠信号,涉及基因表达、剪接还有蛋白质修饰等内容。在26个测试任务里,有25个它表现得比现有最好的模型还要强。AlphaGenome的优势在于它既能看长串DNA,又能做出高清晰度的预测。 理解DNA变异怎么影响功能是个老大难问题,大多数变化(大约占98%)发生在非编码区域。以前的办法要么牺牲分辨率,要么只能看短序列,很难兼顾这两点。AlphaGenome直接把这两个难题都给摆平了。基于这个模型能搞明白变异影响了啥过程的特点,大家可以用它来理解遗传病、改进基因检测,还能给开发新药提供线索。 研究团队表示以后还要继续优化它,比如把能看的物种范围扩大,或者把识别非编码序列的本事练得更强。未来,AlphaGenome有希望让我们对DNA变化引发的那些复杂结果理解得更透彻。