人工智能模型发现潜在药物分子的速度快一千倍

人工智能2022-07-20 14:47:45
最佳答案几何深度学习模型比最先进的计算模型更快、更准确,降低了药物试验失败的机会和成本。整个已知宇宙充满了无限数量的分子。但是,这些分子中

几何深度学习模型比最先进的计算模型更快、更准确,降低了药物试验失败的机会和成本。

整个已知宇宙充满了无限数量的分子。但是,这些分子中有多少部分具有潜在的类似药物的特征,可用于开发挽救生命的药物治疗?数百万?数十亿?万亿?

答案是:novemdecillion,或 1060.这个庞大的数字延长了Covid-19等快速传播疾病的药物开发过程,因为它远远超出了现有药物设计模型的计算能力。从这个角度来看,银河系大约有1亿,或108星星。

EquiBind(青色)预测可以放入蛋白质口袋(绿色)的配体。真正的构象是粉红色的。插图作者:研究人员 / MIT

在将在机器学习国际会议(ICML)上发表的一篇论文中,麻省理工学院的研究人员开发了一种名为EquiBind的几何深度学习模型,该模型比现有最快的计算分子对接模型之一QuickVina2-W快1,200倍,成功地将类似药物的分子与蛋白质结合。

EquiBind基于其前身EquiDock,EquiDock专门使用已故的Octavian-Eugen Ganea开发的技术结合两种蛋白质,该技术是最近的麻省理工学院计算机科学和人工智能实验室,安利捷健康机器学习诊所(Jameel Clinic)博士后,后者也是EquiBind论文的合著者。

在药物开发甚至发生之前,药物研究人员必须找到有前途的类似药物的分子,这些分子可以在称为药物发现的过程中正确结合或“对接”到某些蛋白质靶标上。成功与蛋白质对接后,结合药物(也称为配体)可以阻止蛋白质的功能。如果这种情况发生在细菌的必需蛋白质上,它可以杀死细菌,为人体提供保护。

然而,药物发现的过程在财务和计算上都可能代价高昂,数十亿美元投入到这一过程中,经过十多年的开发和测试,然后才获得美国食品和药物管理局的最终批准。更重要的是,90%的药物一旦在人体中进行测试就会失败,因为它们没有效果或副作用太多。制药公司弥补这些失败成本的方法之一是提高成功药物的价格。

目前寻找有前途的候选药物分子的计算过程是这样的:大多数最先进的计算模型依赖于大量的候选药物采样以及评分,排名和微调等方法,以获得配体和蛋白质之间的最佳“拟合”。

Hannes Stärk是麻省理工学院电气工程与计算机科学系的一年级研究生,也是该论文的主要作者,他将典型的配体与蛋白质结合方法比作“试图将钥匙放入具有大量钥匙孔的锁中”。典型的模型在选择最佳模型之前,会耗时地对每个“拟合”进行评分。相比之下,EquiBind直接在一步中预测精确的关键位置,而无需事先了解蛋白质的靶口袋,这被称为“盲对接”。

与大多数需要多次尝试才能在蛋白质中找到配体有利位置的模型不同,EquiBind已经具有内置的几何推理功能,可帮助模型学习分子的基本物理学,并在遇到新的,看不见的数据时成功推广以做出更好的预测。

这些发现的发布迅速引起了行业专业人士的关注,包括Relay Therapeutics的首席数据官Pat Walters。沃尔特斯建议研究小组在已经存在的用于肺癌,白血病和胃肠道肿瘤的药物和蛋白质上尝试他们的模型。虽然大多数传统的对接方法都未能成功结合在这些蛋白质上起作用的配体,但EquiBind成功了。

“EquiBind为对接问题提供了一种独特的解决方案,包括位姿预测和结合位点识别,”Walters说。“这种方法利用了来自数千种公开可用晶体结构的信息,有可能以新的方式影响该领域。

“我们感到惊讶的是,虽然所有其他方法都完全错误或只得到了一个正确方法,但EquiBind能够将其放入正确的口袋中,因此我们很高兴看到结果,”Stärk说。

虽然EquiBind已经收到了来自行业专业人士的大量反馈,帮助团队考虑了计算模型的实际用途,但Stärk希望在即将于7月举行的ICML上找到不同的观点。

“我最期待的反馈是如何进一步改进模型的建议,”他说。“我想和那些研究人员讨论...告诉他们我认为接下来的步骤是什么,并鼓励他们继续将模型用于自己的论文和自己的方法......我们已经有许多研究人员联系并询问我们是否认为该模型对他们的问题有用。

这项工作部分由药物发现和合成联盟资助;贾米尔诊所;DTRA发现针对新兴威胁的医疗对策计划;DARPA加速分子发现计划;麻省理工学院-武田奖学金;NSF探险队资助了合作研究:通过代码了解世界。

这项工作是为了纪念Octavian-Eugen Ganea,他为几何机器学习研究做出了重要贡献,并慷慨地指导了许多学生 - 一位有着谦逊灵魂的杰出学者。

免责声明:本文由用户上传,如有侵权请联系删除!