新药研发周期长、投入高、失败率高,其中“为特定疾病靶点找到合适的小分子候选物”长期被视为关键瓶颈之一。传统研发路径通常依赖实验高通量筛选与计算模拟相结合:前者成本高、资源消耗大,后者往往需要对分子结合过程进行逐步推演,计算量巨大。随着可研究靶点与化合物库规模持续扩张,筛选速度与覆盖范围的矛盾更加突出,行业迫切需要更快、更可扩展、更具普适性的早期发现手段。 造成此瓶颈的核心原因,于靶点蛋白结构复杂、候选小分子数量呈指数级增长,而传统计算方法往往围绕“精细模拟”展开,虽然能够提供较强的物理解释性,却难以在大规模、全覆盖场景中保持效率。尤其在面对基因组尺度的靶点集合时,如果仍沿用逐一对接、逐一评估的思路,计算资源与时间成本将迅速攀升,影响新药早期探索的速度与迭代频率。 针对上述难题,清华大学智能产业研究院(AIR)教授兰艳艳联合生命学院、化学系团队研发的DrugCLIP平台提出了不同于传统逐步模拟的筛选思路:将蛋白质与小分子转化为计算机能够快速识别和比较的“专属信号”,通过自动化的精准匹配完成候选分子与靶点之间的快速评估,从而绕开部分高成本的逐步结合计算流程。研究显示,该平台在通用高性能计算条件下表现出显著的速度优势:单日可完成31万亿次匹配计算,筛选100万个候选分子耗时可缩短至极低水平,与常见方法相比实现数量级提升。这一突破使“更大规模、更广覆盖”的虚拟筛选具备现实可行性,为在早期阶段迅速缩小候选范围、提高命中率提供了工具支撑。 速度提升带来的直接影响,是新药发现范式的潜在变化。以往在资源约束下,研发团队往往只能在有限靶点、有限化合物库中做取舍,导致某些“冷门靶点”或“长尾分子”难以得到系统评估。DrugCLIP所展示的超高通量能力,使得在更大搜索空间内开展探索成为可能,有助于提高候选发现的多样性与覆盖度,并为后续实验验证环节提供更集中、更有针对性的候选集合,从而在整体链条上提升研发效率与资源利用率。 在成果应用层面,研究团队依托该平台完成了人类基因组尺度的靶点覆盖筛选:对约1万个靶点、2万个关键位点进行系统性评估,分析超过5亿个候选小分子,富集得到200多万个潜在有效分子,并据此建立大规模药物靶点匹配数据库,向全球科研人员开放共享。开放共享的举措有望降低重复计算与信息壁垒,促进基础研究、药物化学与临床需求之间的协同,加快多学科交叉创新。对高校和科研机构而言,这类公共数据基础设施也有望成为训练、验证与迭代新模型、新方法的重要资源,推动研发工具链标准化与可复用。 需要指出的是,超高通量筛选并不等同于“直接得到新药”。虚拟筛选仍需与实验验证、药代动力学评估、安全性评价等环节相衔接,才能完成从候选到药物的转化。面向下一步发展,业内普遍关注三上工作:一是加强与湿实验平台的闭环联动,在真实生物体系中快速验证、纠偏与迭代;二是提升对不同靶点类型、不同构象变化与复杂结合模式的适配能力,扩大方法的适用边界;三是在数据库开放的基础上完善数据治理与评测体系,建立可对比、可复现的基准与标准,推动成果更稳定地服务产业与公共健康需求。 从前景看,随着生命科学数据不断积累、计算基础设施持续升级以及跨学科协同深化,药物研发正在从“经验驱动”向“数据与计算驱动”加速转变。类似DrugCLIP的高通量平台若能在更多真实项目中验证其稳定性与泛化能力,将有望缩短早期发现周期、降低试错成本,并在罕见病、传染病以及复杂慢病等领域为候选挖掘提供新的速度与规模优势。,开放数据库带来的全球协作空间,也可能促成更多跨机构、跨领域的联合攻关,提高创新成果的转化效率。
DrugCLIP平台的研发成功标志着新药筛选进入高效精准阶段。此成果展现了中国科学家的创新能力,将为全球医药发展带来新动力。随着平台应用推广,更多创新药物有望加速面世,造福患者健康。