您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[未知机构]:AI技术在新药研发中的应用-20240328 - 发现报告
当前位置:首页/会议纪要/报告详情/

AI技术在新药研发中的应用-20240328

2024-03-28-未知机构绿***
AI技术在新药研发中的应用-20240328

一、综述 1.Al赋能新药研发前景探讨 Al技术历史与研发应用:Al技术自1950年起发展,由于算法和大数据的进步促成了其在新药研发中的应用,尤其在神经网络技术的快速迭代发展中表现突出。 新药研发痛点与Al优势:新药研发周期长、风险高、成本高,Al可以优化临床前新药候选物的质量,提升研发效率。Al能帮助解决目标识别难、高通量筛选和化合物优化等痛点,降低成本,提高效率。 一、综述 1.Al赋能新药研发前景探讨 Al技术历史与研发应用:Al技术自1950年起发展,由于算法和大数据的进步促成了其在新药研发中的应用,尤其在神经网络技术的快速迭代发展中表现突出。 新药研发痛点与Al优势:新药研发周期长、风险高、成本高,Al可以优化临床前新药候选物的质量,提升研发效率。Al能帮助解决目标识别难、高通量筛选和化合物优化等痛点,降低成本,提高效率。未来趋势:未来Al在新药研发中将成为关键工具,提升靶点的验证速度,加速化合物发现和优化,预期将有更大的创新和突破。 2.Al赋能新药研发路径 新药研发中数据整合困难,需要更完整的解决方案实现各类数据(如活性、毒性(药代动力学)的高效、及时整合。 Al在靶点发现、ADMET性质预测、逆合成分析中的应用前景广阔,但各有难点,如靶点数据解析、分子生成的可合成性等,大模型可能成为未来研发的关键。 国内外药企积极运用Al技术,推动自建Al团队和ADME预测模型,强化数据积累与标准化,与外部Al平台合作,但尚未有突破性成果。 3.药企运用Al技术加速新药研发 Al在新药研发中的应用:构建化合物性质预测模型,提升新药研发效率 Al技术在新药研发中面临数据量不足的挑战,数据驱动的模型推广能力有限,临床应用前景待提升跨国药企及Al公司积极开发Al结合应用:AL与细胞绘画技术结合用于预测潜在毒性,Al在图像识别上帮助从专利文献中提取化学结构,提升研究效率并支持新药设计 4.Al驱动新药研发前瞻 国内药企利用CADD开发GPCR相关药物,目前拥有稳定的产品管线,有国内领先的团队,某些公司已经上市。Al技术在新药研发中面临挑战高质量数据不足导致模型建立困难,药物研发的迭代特性和多目标优 化问题使应用Al技术难度大。 长远看,随着数据积累、生物学理解加深和算法及算力进步,Al在研发效率提升方面将具有重大潜力。 5.数据挑战与未来前景 Al制药的数据训练问题:目前大多数数据来源论文与实验结果呈阳性偏差,可能会导致Al模型只识别正确数据,忽略错误数据,影响未来应用效果。 Al在生物模型建立上的未来发展:当前Al可以较好地预测蛋白质结构和相互作用。但创建细胞、器官至整个生物体的模型挑战极大,短期内难以实现,需生物学领域重大进步。 Al制药中数据源问题:CRO公司虽参与实验但不完全掌握数据,真正掌握数据的是MSCs等机构,因此CRO在Al制药领域并无数据优势。二、详细介绍 1.Al赋能新药研发前景探讨 过来,请开始。好的,我直接开始了。 各位晚上好,我是刘博士,专注于Al在新药研发领域的应用。在此之前,我在跨国药企和阿尔曼公司等担任过重要职位。今天我很高兴能分享一些个人对Al在新药研发应用的看法。我本人主要从事小分子新药研发工作,在CRO公司和外企负责计算机辅助药物设计(CADD)。后来则在一家Al新药公司从事药物化学和CADD工作。在这个领域,我的了解主要源于项目经验和同行之间的交流。需要指出的是,我的分享可能更适用于小分子制药领域,对其它领域可 能不完全适用。 今天的分享内容将围绕以下几个方面:首先是对Al技术进行简单介绍,其次是新药研发中关注的关键问题以及存在的痛点,紧接着会讲述Al如何助力新药研发,以及Al在新药设计(AIDD)与计算机辅助药物设计(CADD)之间的区别。因为这两者在外行看来可能令人困惑,实际上它们有很大的不同。最后,我将总结Al在新药领域未来的发展趋势。 Al技术的发展历史悠久,早在1950年就已经开始探索。Al经历了起伏波折,原因之一是早期Al技术未能满足过高的期望。直到1990-1993年,由于算法的突破和大数据的积累,神经网络技术得以快速发展,促进了Al技术的进步。现如今,Al被普遍认为将在未来改变我们的生活,被视为第四次工业革命的驱动力。 新药研发大家或许已经较为熟悉,它是一个周期长、风险高、成本巨大的行业。主要的成本集中在临床阶段。然而,提高研发效率的关键在于早期阶段提升候选药物的质量。本质上,我们要提升候选药物的药效和安全性,从而减少后期临床试验中遇到问题的概率。 早期研发的痛点包括找到有效的靶点十分困难,因为竞争者众多,而靶点从被发现到验证需多年时间。发现一个靶点并不意味着它即刻成为潜在的治疗靶点。研发中还需要发现苗头化合物, 它们能够作用于靶点,影响其生物学功能,产生治疗效果。这些初步化合物通常依赖高通量筛选来发现,但我们急需成本低效率高的策略。 找到苗头化合物后,接下来的任务是将其优化为候选药物。过程中要提高活性,改善药动学性质,以及剔除可能的毒性副作用。这是一场复杂的技术游戏,一个问题的解决往往伴随着新问题的出现,整个过程如同解开一头牵动全身的线团。 非常感谢大家今天的聆听,如有任何问题,欢迎在演讲后自由提问。 2.Al赋能新药研发路径 首先,数据整合方面确实存在一些难点。在药物研发过程中,生物活性数据、毒性数据以及药代动力学(PK)数据的及时整合至关重要。需要一个用户友好的接口,方便研究人员进行效果分析,以便设计新的化合物解决具体问题。不同公司有各自的解决方案,但往往缺乏完整性,使得行业迫切需要一套完善的solution Al在新药研发中的应用具有多个关键机遇。首先,随着组织数据的累积,Al的靶点发现功能扮演着重要角色,辅助科研人员通过数据模式识别发现新的靶点。其次,ADMET属性的预测已经被广泛应用,是目前大多数公司工作量最大的部分。再来,逆合成分析虽已有商业软件支持,但在复杂分子设计上还显不足。当前的Al算法在这方面有潜在的突破机会,我们对此抱有期待。 类药分子的生成是一个广泛讨论的主题,但真正生成具有活性的分子仍然具有挑战性。此外,生成分子的可合成性也是一个值得深入探讨的问题。相较于商业化合物库筛选,分子生成的成本和实用性尚待优化,不过,如果未来在分子可合成性上实现大幅进步,这个领域仍值得期待。生物医药大模型引领了新的关注焦点,希望实现将广泛的生物医药知识整合,便于快速查询及提供建议。临床药物和试验设计领域也是国内外许多公司正在积极探索的。 接下来,谈谈MMC公司在Al方面的实践。作为老牌大型药企,该公司近年来积极推进Al应用领域。他们建立了自己的Al团队,利用内部数据训练Al模型,预测新化合物的ADME属性,并构建项目专用模型以提高预测准确性。此外,该公司高度重视数据的积累与标准化,统一数据来源确保高质量数据的可用性。 此外,加强外部合作也是该公司的一个战略方向,通过测试与Al平台公司的合作,探索新项目的可能性。虽然目前为止尚未看到突破性成果,但这是一个值得关注的探索阶段。3.药企运用Al技术加速新药研发公司在Al领域的具体应用首当其冲的是一个名为GTTTP的化合物性质预测模型。我们自建的Al团队 构建了一个包括18种ADME早期信息预测的模型别,这些模型覆盖了溶解度、体内代谢等特性,并且被集成进公司内部数据展示软件中。通过这些模型,研发人员能在查看数据时迅速更换分子ID,并即时获取相应的化合物性质,实现所见即所得。你画出结构后,立即就能知道它是否在向优化方向改变,这一点非常重要。接下来,我会详细展开这块的讨论。 第二个项目是Al加细胞绘画,主要是利用Al与细胞绘画技术结合,预测化合物的潜在毒性。这基于计算机视觉的强大功能,能够读取、识别细胞中化合物引起的变化,并据此做出解读。第三个领域则是临床病人的管理,在临床阶段,他们有一个平台帮助管理病人,为他们在临床试验中提供更好的体验。不过我的专长还是在机器预测模型方面。 所谓的“基金运模型”预测的18种性质实际上是更细致的细分。比如CK抑制、蛋自的血浆蛋白结合、透膜线和溶解度等是分开的品类,合起来一共是18种。模型使用的是内部数据集,相较于目前流行的数亿级别的Al模型数据,三万多个数据点显得微不足道。 因此,训练出的模型多是分类模型,非回归模型,即判断预测性质是否大于某个阈值。由于数据量的限制,模型的推广能力较弱。以efficiency为例,绝大多数模型的效率低于0.6,这意味着只有60%的新化合物能被预测,而剩下40%无法给出预测结果。不过,一旦模型给出预测,其置信度还算不错,多数情况下预测结果有70%的准确性。 我们可以看到,即便是大型制药公司能够使用的数据也十分有限,行业历史积累的数据并不一定适用于训练模型,只有来源统一、规范清洁的数据才真正有价值。 我之前所在的Al制药公司也尝试利用Al进行药物研发。他们利用Al模型对蛋白质序列进行药物相互作用预测,但事实上,这种模型的推广能力有限。又比如小分子结构图像识别算法,它能帮助我们从文献中提取化学结构,并转换为标准二维结构式,这对数据搜集非常有帮助。此外,还有对ADM性质进行预测的模型,虽然基于公共数据集,但由于缺乏企业自有的数据,这些模型的预测能力通常较弱。我并不完全了解公司在生物医药领域的大模型开发现状,但理念是提供便利,帮助科研人员更有效地查询信息。 谈到Al与新药研发的结合,我们不得不提国内几家代表性企业。例如银凌智能,他们构建了三大平台:一是靶点发现,二是药物设计,三是临床实验设计工具。但他们也意识到仅靠平台可能有天花板,于是开始发展自研管线,并有了不少成功案例。同样,金泰从新型预测起家,逐步扩展到小分子发现领域,虽然已上市,但面临的市场认可仍有挑战。一般而言,结合平台和管线的企业似乎更具备市场竞争力。 AIDD和CDD分别具有独特的特点。AIDD靠数据驱动,能够减少人工介入,但解释性较差。而CDD以结构为基础,推出的结果则具有较高的可解释性,有利于理解药物作用机制。综上所述,Al在新药研发领域的应用仍面临数据、模型推广能力和结果可解释性等多重挑战,但其潜力和价值不容忽视。未来处于探索阶段的Al细胞绘画、患者管理平台和分子生成等技术将如何助力 药物发现与临床试验,值得行业持续关注。 4.Al驱动新药研发前瞻 在国内,也有一些公司以计算辅助药物设计(CADD)为主导发展新药。可以说,他们拥有国内最为强大的CADD团队,并专注于GPCR领域。目前,这些公司已经建立了一条稳健的产品管线,在GPCR绩效平稳方面拥有自己的产品。相较于国外的Al驱动药企,这些国内CADD公司相对而言生活得更加轻松,其团队已经公开上市。 最近一个经典的CADD成功案例是五天公司与尼克斯的交易。五天公司购买了尼克斯的TYK2抑制剂,这笔交易金额创历史纪录:首付款高达40亿美元,里程碑付款预计为20亿美元,这是一个非常惊人的成果。这个分子的开发采用了CADD中的经典方法——自由能计算。之所以这种方法之前未被广泛应用,是因为其需要消耗巨大的计算能力。在过去,由于算力不足,大 规模运用自由能计算于新药研发是不现实的。通常人们只能利用分子对接等简化的计算方法来进行预测。但是近年来,随着算力的显著增强,利用自由能计算的方法大规模应用于药物研发已经成为可能。我认为自由能计算的这种突破可能会在未来大幅推动药物研发的进展,帮助找到更优质的分子。 短期内,Al在药物研发中的应用可能仍然非常困难,最大的限制因素是高质量数据的严重缺乏。这是建立可靠模型的前提,而目前这样的数据量不足。另外,药物发现的复杂性也使得Al技术的应用更加艰难。药物研发过程,特别是在早期,实质上是一个不断迭代和进化的过程,这 通常被描述为DDMP循环(设计、合成、测试、分析),在迭代过程中不断出现新问题。结构的变化可能导致全局性质的变化,包括毒性和代谢特性。因此,Al在这一迭代过程中需要解决的问题是不断变化的,