近日,由威尔康奈尔医学院Olivier Elemento与麻省理工学院Regina Barzilay共同牵头,联合薛定谔、安进、Genesis Therapeutics等多家企业,以及哥伦比亚大学、纪念斯隆-凯特琳癌症中心、加州大学、斯坦福大学等科研机构的多位知名学者,在Nature Biotechnology 上发表了一篇文章。
该文基于美国“抗癌登月计划”(Cancer Moonshot)研讨会形成的共识,系统阐述了人工智能(AI)如何颠覆传统药物研发模式,为攻克长期以来困扰癌症治疗的“不可成药靶点”(undruggable target)提供了新思路与新框架。
以下是文章主要内容:
长期以来,大量癌症靶点因被归为“不可成药”而迟迟未能转化。然而,随着KRASG12C抑制剂的成功研发,这一传统认知正被打破。当前,AI技术与蛋白降解剂、变构调节剂、生物分子凝聚体调控剂等新型干预手段的结合,正在带来前所未有的突破。
AI不仅能够加速药物研发流程,还可通过预测蛋白质结构与动力学变化、开展系统层面的生物学分析、指导设计全新作用机制的分子,真正为攻克不可成药靶点开辟道路。当然,数据质量、模型验证与临床转化仍然是该领域面临的主要挑战。
与常规药物发现不同,不可成药靶点领域的数据往往极为稀缺、阴性结果很少被公开发表、机制也常常不明。因此,AI方法必须从以往依赖大数据的内插(interpolating)模式,转向基于有限复杂信息进行外推(extrapolating),这要求开发全新的算法策略与验证体系。
重构靶点分类系统,开发专用AI工具
目前所用的“不可成药”分类过于宽泛,无法体现不同靶点在分子机制层面的差异。推动领域发展的关键一步,是建立基于生物学机制的功能性靶点分类系统,从而为每一类靶点定制AI解决方案。
例如,转录因子通常缺乏传统小分子药物所需的结合口袋,但其功能依赖于大型蛋白质复合物的组装。AlphaFold2、OpenFold等AI工具已能够对这些复合物进行高精度结构建模,为靶向蛋白质-蛋白质相互作用界面提供结构基础。
对于构象高度动态变化的靶点,挑战在于其柔性极大。解决思路不在于运行更长时间的分子动力学模拟,而在于对构象空间进行更广泛的采样,以捕捉瞬态暴露的成药口袋。美国Anton超算项目采用“广度优先、而非长度优先”的策略,成功在多个传统不可成药靶点上发现隐藏结合位点。
MYC是另一类典型的高价值难成药靶点,其功能与在生物分子凝聚体中的分区行为密切相关。AI可以用于预测和设计调节凝聚体形成或动态的小分子,从而规避直接抑制MYC活性的难题。此外,约40%的人类蛋白质含有固有无序区,而生成式AI模型(例如RFdiffusion)可针对这类特殊结构域设计靶向性生物制剂。
在直接靶向癌蛋白不可行时,AI驱动的系统生物学提供了一种替代策略。通过整合功能基因组和转录组等组学数据,AI能够识别合成致死交互基因、挖掘信号通路上可成药的上下游节点,实现间接干预。AI也助力推进多靶点药理学(polypharmacology)的发展,通过理性设计的多靶点协同作用实现治疗效益。
这些案例说明,我们必须超越“可成药/不可成药”的简单二分法,建立能够精准指导AI方法选择的靶点分类系统。
构建高质量基准数据集
AI的性能高度依赖高质量数据,而在不可成药靶点领域,数据稀缺、阴性结果未公开共享等问题尤为突出。为有效验证和提升AI模型,此领域需建立标准化、开放、且针对特定靶点类别的基准数据集。
通用基准远远不够,必须设计具有针对性的测试集。例如,评估瞬态结合口袋预测模型,需选用经实验验证含隐匿位点的蛋白质结构;考察蛋白质-蛋白质相互作用干扰方案的效能,需借助已知界面突变及结合亲和力变化的数据。
对MYC等依赖于生物分子凝聚体的靶点,需开发可量化凝聚体行为调控效果的基准体系。此外,像DSMBind这类面向稀疏数据的结合能预测工具,必须经过严格阴性数据(例如高通量筛选中的非结合分子)验证,以确保其区分真实结合与伪信号的能力。
临床转化与安全性新思路
将AI设计的分子应用于临床,还需跨越安全与验证的双重挑战。安全性评估不能停留在预测少数抗靶点结合,而应发展到能模拟全蛋白网络层面的组织特异性后果与通路扰动,这对凝聚体调节剂等新型机制尤为关键。
临床验证策略也需创新。例如针对MYC凝聚体分布调节剂的药效评价,传统靶点占据率生物标志物可能不再适用,需开发基于蛋白质组或影像学的新型标志物,动态反映下游效应。同时,应提前与监管机构沟通,共同确立新的临床验证框架。
总结
应对上述挑战,需构建跨学科、跨部门的协作生态。对此,我们提出三大目标:
建立联合数据库,纳入基于机制的功能分类体系,支持阳性和阴性实验数据的共享,可通过数据信托机制保护知识产权;
推动开源模型、标准化接口(API)和专项基准数据集的开发,降低研究门槛,促进创新迭代;
推动政府机构如NCI、DOE、ARPA-H等的持续投入,建设数据基础设施,资助高风险高回报的新模态研究,并与FDA等监管机构协同建立新药审评框架。
AI与创新治疗模式的结合,正在系统性地解锁“不可成药”蛋白质。我们必须从孤立努力转向协同作战,共同构建新分类体系、高质量基准与临床转化路径。这一转变虽需突破文化壁垒,但回报同样巨大,有望为人类疾病治疗开辟全新的靶点版图。