清华大学突破性成果引领新药研发革命基因组级靶点筛选效率提升百万倍

新药研发周期长、投入高、失败率高，其中“为特定疾病靶点找到合适的小分子候选物”长期被视为关键瓶颈之一。传统研发路径通常依赖实验高通量筛选与计算模拟相结合：前者成本高、资源消耗大，后者往往需要对分子结合过程进行逐步推演，计算量巨大。随着可研究靶点与化合物库规模持续扩张，筛选速度与覆盖范围的矛盾更加突出，行业迫切需要更快、更可扩展、更具普适性的早期发现手段。造成此瓶颈的核心原因，于靶点蛋白结构复杂、候选小分子数量呈指数级增长，而传统计算方法往往围绕“精细模拟”展开，虽然能够提供较强的物理解释性，却难以在大规模、全覆盖场景中保持效率。尤其在面对基因组尺度的靶点集合时，如果仍沿用逐一对接、逐一评估的思路，计算资源与时间成本将迅速攀升，影响新药早期探索的速度与迭代频率。针对上述难题，清华大学智能产业研究院（AIR）教授兰艳艳联合生命学院、化学系团队研发的DrugCLIP平台提出了不同于传统逐步模拟的筛选思路：将蛋白质与小分子转化为计算机能够快速识别和比较的“专属信号”，通过自动化的精准匹配完成候选分子与靶点之间的快速评估，从而绕开部分高成本的逐步结合计算流程。研究显示，该平台在通用高性能计算条件下表现出显著的速度优势：单日可完成31万亿次匹配计算，筛选100万个候选分子耗时可缩短至极低水平，与常见方法相比实现数量级提升。这一突破使“更大规模、更广覆盖”的虚拟筛选具备现实可行性，为在早期阶段迅速缩小候选范围、提高命中率提供了工具支撑。速度提升带来的直接影响，是新药发现范式的潜在变化。以往在资源约束下，研发团队往往只能在有限靶点、有限化合物库中做取舍，导致某些“冷门靶点”或“长尾分子”难以得到系统评估。DrugCLIP所展示的超高通量能力，使得在更大搜索空间内开展探索成为可能，有助于提高候选发现的多样性与覆盖度，并为后续实验验证环节提供更集中、更有针对性的候选集合，从而在整体链条上提升研发效率与资源利用率。在成果应用层面，研究团队依托该平台完成了人类基因组尺度的靶点覆盖筛选：对约1万个靶点、2万个关键位点进行系统性评估，分析超过5亿个候选小分子，富集得到200多万个潜在有效分子，并据此建立大规模药物靶点匹配数据库，向全球科研人员开放共享。开放共享的举措有望降低重复计算与信息壁垒，促进基础研究、药物化学与临床需求之间的协同，加快多学科交叉创新。对高校和科研机构而言，这类公共数据基础设施也有望成为训练、验证与迭代新模型、新方法的重要资源，推动研发工具链标准化与可复用。需要指出的是，超高通量筛选并不等同于“直接得到新药”。虚拟筛选仍需与实验验证、药代动力学评估、安全性评价等环节相衔接，才能完成从候选到药物的转化。面向下一步发展，业内普遍关注三上工作：一是加强与湿实验平台的闭环联动，在真实生物体系中快速验证、纠偏与迭代；二是提升对不同靶点类型、不同构象变化与复杂结合模式的适配能力，扩大方法的适用边界；三是在数据库开放的基础上完善数据治理与评测体系，建立可对比、可复现的基准与标准，推动成果更稳定地服务产业与公共健康需求。从前景看，随着生命科学数据不断积累、计算基础设施持续升级以及跨学科协同深化，药物研发正在从“经验驱动”向“数据与计算驱动”加速转变。类似DrugCLIP的高通量平台若能在更多真实项目中验证其稳定性与泛化能力，将有望缩短早期发现周期、降低试错成本，并在罕见病、传染病以及复杂慢病等领域为候选挖掘提供新的速度与规模优势。，开放数据库带来的全球协作空间，也可能促成更多跨机构、跨领域的联合攻关，提高创新成果的转化效率。

DrugCLIP平台的研发成功标志着新药筛选进入高效精准阶段。此成果展现了中国科学家的创新能力，将为全球医药发展带来新动力。随着平台应用推广，更多创新药物有望加速面世，造福患者健康。

清华大学突破性成果引领新药研发革命 基因组级靶点筛选效率提升百万倍

清华大学突破性成果引领新药研发革命基因组级靶点筛选效率提升百万倍