3月22日,记者张佳欣从北京发来消息,AI预测工具“阿尔法折叠”终于迎来重大升级。这回最大的亮点,是首次给数百万个由AI生成的蛋白质复合物结构开放了权限。大家知道蛋白质很少单枪匹马干活,通常是几个甚至几十上百个分子凑在一起工作,“阿尔法折叠”这次把注意力放在了这部分数据上。这就像是给科学家们提供了一套“乐高积木”的拼装指南。 这次升级由欧洲分子生物学实验室和欧洲生物信息学研究所牵头,谷歌旗下的深度思维公司、英伟达还有韩国首尔大学也加入了进来。通过对人类、小鼠、酵母以及结核分枝杆菌等20种研究比较透彻的物种进行深度分析,研究团队一共算出了大约3000万个同源二聚体的预测结果。这当中挑选出了质量最高的170万个高置信度数据,直接装进了数据库里。这个数据集里还有不少跟人类健康和疾病关系密切的蛋白质。 自从2021年正式开放以来,“阿尔法折叠”已经攒下了大约2亿个单独的蛋白质结构数据。但其实蛋白质大多是通过相互作用才发挥作用的。要想预测这种复杂的复合物结构,对计算机的算力要求特别高。研究人员把重点放在了同源二聚体上,也就是由两个完全一样的蛋白质组成的复合物。科学界觉得,把这些复合物结构纳入数据库,就像是从“单个分子”走向了“分子网络”的关键一步。 为了防止大家误把电脑算出来的东西当成真的,团队特意提醒大家要小心使用AI预测结果。毕竟有些结构可能跟真实生物情况不一样,最后还得靠实验去验证一下。团队还透露说,接下来“阿尔法折叠”还会进一步扩充,准备加入由两个不同蛋白质组成的异源二聚体数据。申久燕编辑点评说,蛋白质就像“乐高”积木一样喜欢抱团,“阿尔法折叠”这次升级就像是给大家发了一套拼装说明书。有了这套说明书,科学家就能更清楚地看清每一块积木的样子,也能更快地设计出复杂的蛋白质结构了。 责编:申久燕 编辑:英伟