助力药物发现的 AI 技术探索

产业4个月前发布 智能之星
6 0 0
助力药物发现的 AI 技术探索

编辑丨toileter

药物研发在历史上一直是一项艰巨且低效的任务。德国汉堡生物技术公司Evotec的计算化学家David Pardoe指出,在过去一百年中,仅发现了约7000种罕见疾病的500种治疗方案。然而,理论上,人工智能(AI)有潜力解决制药过程中的两个主要挑战:较长的耗时以及高昂的成本。

通过将潜在药物分子的三维几何形状与其原子结构相结合,AI能够模拟药物与目标蛋白质的相互作用。这一过程允许研究人员调整设计,从而提升潜在药物的有效性,或者使算法识别出新的研究靶点。

尽管数据的量级似乎暗示AI对药物开发的转型即将来临,但情况并非如此乐观。所收集数据的质量常常未能满足需求,许多数据在收集时均未考虑机器学习的要求。

为反映研究者们迫切的需求,《Nature》期刊近期进行了访谈,梳理出当前亟需解决的问题,希望AI能够在药物发现和开发领域实现积极的变革。

标准化报告与方法

学术界自豪于其灵活性,愿意在其学习方法中吸纳更为完善的工艺。然而,这种思维方式往往会给AI的学习带来障碍。

当不同实验室采用不一致的方法、试剂和设备时,实验结果中可能会引入称为批次效应的系统性差异。这种偏差会在数据模型中造成错误,而在AI学习过程中则极为致命,导致对结果的误判,从而削弱了在AI兴起之前构建的许多大型公共数据库的作用。

部分专家认为,为生成有序的数据以供AI使用,制订实验的操作及报告规则是最佳途径。人类细胞图谱便是一个成功的例子,该全球项目自2016年启动以来,已对人体中数百万个细胞进行了严格和标准化的绘制,从而提供了一致的数据,是寻找潜在药物靶点的AI算法的重要资源。

助力药物发现的 AI 技术探索

图示:人类肺细胞图谱(图源:网络)

Pardoe强调,若不再进一步努力生成协调且相关的数据,继续开发更先进的算法则可能没有实际意义。他指出,“一旦我们拥有这些‘优质’数据,就能在正确的方向上取得快速而显著的进展。”

认识到负面结果的价值

对于学术研究者而言,报告实验失败的案例往往得不到应有重视,导致此类研究难以发表。这种对研究结果的内在偏见并不是什么新鲜事,但其影响尤其体现在AI应用中。

伦敦国王学院的药物化学家米拉兹·拉赫曼(Miraz Rahman)举例说明在开发新抗生素时所面临的这一偏见。他指出,许多相关文献显示,伯胺(与氨结构相似的小分子)能促使药物进入细菌内部,但当他寻求模型时,系统不断推荐含伯胺的化合物,这最终对他的研究没有任何帮助。

为解决这一问题,可以从明确编纂负面及正面结果的意图开始。加州大学旧金山分校的结构生物学家詹姆斯·弗雷泽(James Fraser)主导了一项与药物在人体内吸收、分布和代谢(统称为ADME)相关的研究,建立了相应的蛋白质结合实验及结构数据集,致力于开发用于优化候选药物药代动力学的预测性AI模型。

充分利用资源以实现更高效成果

制药公司拥有关联巨大数据,包括负面结果,并努力以统一的方式收集这些数据,这使其成为AI模型理想的消化来源。然而,进入公共领域的数据量却屈指可数,这导致其潜在价值未能充分释放。

一些研究者认为,通过庞大的数据量和更为智能的处理方式,可以有效克服AI在药物发现应用中的诸多挑战。

位于马萨诸塞州波士顿的人工智能生物技术公司Insilico Medicine,则致力于将美国政府数十亿美元的研究投资所产生的数据与其他相关的出版物、临床试验、专利,以及遗传和化学数据库进行整合与加工。

助力药物发现的 AI 技术探索

图示:Insilico Medicine(图源:网络)

到2019年底,Insilico通过其AI驱动的药物发现平台PandaOmics发现了一种与纤维化疾病相关的靶点,之后又利用其生成式AI平台Chemistry42来寻找可阻断该靶标的化合物。

无疑,利用大型公共数据池中的信息是一项复杂的任务,尤其是在处理大量RNA序列时,这些数据通常是来源于被破碎的组织样本,对多个细胞的基因表达进行了整合。

文章中提到的AI工具

Frase
Frase

一站式SEO内容优化与AI写作工具

© 版权声明

相关AI热点

暂无评论

none
暂无评论...