我国科学家突破药物筛选技术瓶颈 全基因组靶向药物开发迈入新纪元

长期以来,面向全基因组的药物发现被视为计算生物学与新药研发领域的关键命题。

人类基因组约编码2万种蛋白质,其中相当部分与疾病发生发展相关,但现实中可被药物有效作用的靶点比例有限,大量潜在靶点因缺乏结构信息、缺少先导化合物或验证路径不清而处于“难以成药”的状态。

与此同时,小分子化学空间接近无限,传统实验筛选成本高、周期长,单纯依靠增加湿实验规模难以覆盖庞大组合。

即便采用分子对接等主流计算方法,在原子尺度上进行力场模拟与构象搜索,也常受制于计算量与精度权衡,全基因组尺度的系统性筛选难以落地。

造成这一困境的核心原因在于传统范式的“物理模拟瓶颈”。

分子对接强调对相互作用过程的细粒度刻画,但当候选分子规模达到亿级乃至更高数量级时,计算代价呈指数式攀升;当靶点规模进一步扩展到全基因组范围,任务复杂度则从“可优化”转向“难承受”。

在精度、通量与化学空间规模之间,行业长期面临结构性矛盾:要快往往牺牲准确性,要准则难以规模化,要覆盖足够化学空间则计算资源与时间成本不可控。

在此背景下,清华大学智能产业研究院(AIR)与北京智源研究院相关团队提出并研发DrugCLIP平台,并在国际学术期刊《Science》发表成果。

其思路不是延续以物理模拟为中心的路径,而是将蛋白口袋与小分子之间的潜在结合关系转化为可检索的“向量匹配问题”。

具体而言,平台通过深度对比学习等方法,将蛋白口袋三维拓扑特征与小分子化学表征分别编码,映射到同一高维嵌入空间,再以高效向量检索完成大规模打分与候选筛选。

该范式转换借鉴了信息检索领域成熟的工程体系,把“逐一模拟”转为“快速检索”,从而显著提升虚拟筛选的吞吐能力。

为提升对未知靶点的适配性,研究采用自监督的结构预训练策略:从海量蛋白结构数据中构造训练样本,使模型在接触真实药物分子之前就学习蛋白表面结构规律与口袋特征,从而提高对新靶点、新口袋的泛化能力。

在多尺度表征对齐方面,平台通过双编码器体系实现蛋白与小分子在同一空间的可比性,使单节点算力条件下的打分能力达到更高数量级,筛选效率相较传统工具实现百万倍提升。

业内人士指出,这类方法的意义不止于“更快”,更在于让过去因成本过高而无法开展的系统性探索成为可执行任务。

从应用验证看,DrugCLIP不仅在已有靶点上表现出筛选效率优势,也在“暗靶点”场景展示了潜力。

研究以人源E3泛素连接酶TRIP12等此前缺少实验结构与已知抑制剂的靶点为例,直接基于预测结构进行盲筛,获得多个具有活性的候选抑制剂。

另在临床相关靶点去甲肾上腺素转运体(NET)的实验中,候选分子中有一定比例在实验中被证实有效,部分分子活性指标达到或超过既有临床用药水平,并通过结构生物学手段进一步验证其结合可信度。

这些结果表明,面向未知结构或缺乏先导化合物的靶点,基于预测结构与向量检索的虚拟筛选有望成为补充传统路径的重要工具。

更值得关注的是其对行业生态的潜在影响。

研究团队利用该平台完成了全基因组规模的虚拟筛选尝试:覆盖约1万个蛋白靶点、2万个结合口袋,对超过5亿个小分子进行全量对齐,筛得约200万个高潜力“靶点—分子”组合,并据此构建GenomeScreenDB数据库。

若相关资源持续开放并形成稳定更新机制,将有助于降低早期药物发现的门槛,缩短从靶点假设到先导化合物获取的时间,推动学术界与产业界在候选分子验证、作用机制解析、药效与安全性评估等环节更高效协作。

对中小研发团队与跨学科研究者而言,这类公共基础设施可能带来“从零到一”的机会窗口。

当然,虚拟筛选的规模化并不意味着可以替代实验验证。

向量检索与表示学习能显著提高候选发现效率,但候选命中率、可合成性、成药性、脱靶风险以及体内药代动力学等关键问题仍需要严格实验体系支撑。

未来若要进一步释放该平台价值,一方面需加强与结构预测、分子生成、实验高通量验证的联动,建立更闭环的“计算—合成—测试—反馈”体系;另一方面也需推动数据标准、评测基准与可重复性建设,避免不同实验条件下的结果不可比,确保科研资源真正转化为可落地的研发能力。

从前景看,随着结构预测、蛋白口袋识别与表示学习方法迭代,面向全基因组的系统性“药物映射”有望从一次性成果走向常态化服务。

其意义在于把药物发现从少数已知靶点的“重点突破”拓展到更大范围的“广域探索”,为肿瘤、神经退行性疾病等复杂疾病的靶点拓展提供更多选择,也为机制研究提供更丰富的化学工具分子。

若能在开放共享与安全合规之间取得平衡,并形成持续投入的公共平台体系,化学基因组学的长期愿景或将加速走向可用、可验证、可迭代的工程化实践。

DrugCLIP平台的成功研发标志着药物发现领域进入了全新的发展阶段。

从"大海捞针"式的传统筛选到基于人工智能的精准匹配,这一技术跨越不仅是效率的提升,更是研发理念的根本转变。

随着全基因组药物映射时代的开启,人类有望在更短时间内发现更多突破性疗法,为攻克重大疾病提供新的希望。

这一成果也充分展现了中国在前沿科技领域的创新实力和国际影响力。