与ZS合作 智能临床试验:使用生成AI快速跟踪治疗创新 2024年12月白皮书 GettyImages图片: Contents 前言3 执行摘要4 1GenAI将如何改变临床发展5 2障碍,推动者和建议:如何推动临床开发革命12 2.1数据、激励和监管12 2.2创新文化、信任和劳动力因素13 3如果没有人工智能在临床开发中的革命,世界的健康将面临风险 15 Appendix16 贡献者17 尾注18 免责声明 这份文件由世界经济论坛发布,作为对某个项目、洞察领域或互动的贡献。文中所表达的研究发现、解释和结论是世界经济论坛协助并认可的一个协作过程的结果,但这些结果不一定代表世界经济论坛的观点,也不一定反映其全部成员、合作伙伴或其他利益相关方的意见。 使用生成AI快速跟踪治疗创新智能临床试验:2 2024年12月智能临床试验:使用生成AI快速跟踪治疗创新 前言 ShyamBissen 世界经济论坛卫生和医疗保健中心主任 PratapKhedkarZS首席执行官 人工智能(AI)有望对医疗健康领域产生革命性影响——通过改善患者结果并减少成本、克服地理和物流障碍等方式,支持更广泛的医疗健康系统和行业,将护理送到最需要的地方。 临床试验。虽然在人类中测试新药物以评估其安全性和有效性始终是一个复杂而艰巨的过程,但试验日益复杂的性质导致了时间周期延长、成本上升和失败率增加。结果是药物上市的时间变长 ,最终到达患者手中的成本更高。 自2023年以来,世界经济论坛与ZS合作发布了两份关于人工智能对全球健康和医疗保健影响的报告: 在健康领域使用AI扩展智能解决方案:释放对高潜力用例的影响(2023年6月)研究了人工智能在克服全球医疗人员短缺、扩大健康不平等以及不可持续的医疗支出方面的发展潜力; 具有生成性AI的患者第一健康:重塑护理体验(2024年1月)研究了生成AI在赋予患者权力和减 轻卫生系统负担方面的潜力。 生成式AI(GenAI)提供了通过帮助临床开发团队设计更智能的试验并在整个临床试验生命周期中带来新的效率来逆转这一趋势的机会。通过对涵盖生命科学、科技、政府及非政府组织(NGOs)领域领导者的访谈,本文不仅探讨了GenAI如何有可能彻底改变临床开发并消除阻碍其发展的障碍,还考虑了医疗健康领域的各利益相关方如何动员起来克服这些障碍。 本白皮书着眼于通过有效引导实验药物的长期挑战 执行摘要 生成AI有望帮助更快地为患者带来治疗创新,并降低成本。 生命科学领域及相关领域的利益相关者多年来一直努力加快新疗法的研发并降低相关成本。临床开发中的inefficiencies成为了主要障碍,尽管医疗行业持续关注并投入资源,这一问题却愈发严重。 AI也将革新临床开发。它将通过启用新的试验形式(如去中心化临床试验[DCTs])以及整合新数据流(包括真实世界证据[RWE])来改进现有形式来实现这一目标。虽然DCTs在扩大试验参与度 、减轻患者负担和提高试验效率方面展现出潜力 ,但其复杂性至今阻碍了其广泛应用。 –它需要八个 研发时间长达12年:非肿瘤治疗药物临床开发的平均时间约为12年,而肿瘤治疗药物则接近12年 。1 –同时,平均 25亿美元的成本:将一种新的治疗方法推向市场的成本超过25亿美元,2和临床试验占总研究预算的比例 大约40%3 美国制药公司。 –尽管实施 90%的失败率:即使针对可能的发展失败原因尝试了多种策略,临床药物开发的成功率仍然仅为约75%。 10–15%.4 开发药物5未能满足历史上被忽视群体的需求 ,剥夺了这些患者获得实验性治疗的机会,并导致疗效存在差异的疗法的产生。 通过明智的投资和有利的环境,生成式人工智能 (GenAI)可以帮助开发团队优化试验设计、提高试验可行性和选址效率、革新临床运营、自动化数据分析,并加快和完善监管申报。超越传统试验的转型,生成式人工智能还开启了基于实时真实世界证据(RWE)、自适应设计和持续学习的新临床研究方法。 一项ZS分析发现,一家典型的排名前十的制药公司仅通过实施AI驱动的临床试验设计和去中心化试验执行,就能在未来五年内实现超过10亿美元的成本节约。当企业在整个临床开发过程中注入AI时,成本和时间节约将会更高。 生成型AI已经用于革新药物发现。虽然这项工作至关重要,但临床开发瓶颈才是阻碍治疗创新的更大障碍。 在访谈中,制药行业、科技sector、NGOs等领域的临床开发领导者表示相信Gen 然而,实现这一目标存在障碍:分散的数据生态系统;不足的数据标准和基础设施;缺乏系统性的数据共享激励机制;行业惰性;模糊的监管环境;以及技能缺口。本白皮书呼吁政策制定者、生命科学专业人士及其他相关人员团结起来,利用生成式人工智能的力量改进临床开发。 1 GenAI将如何改变临床发展 由于GenAI,五个临床开发过程已经成熟。 通过临床试验推进实验性疗法是一个艰难的过程。世界经济论坛和ZS采访的临床开发领导者认为,有七个核心开发过程有望进行变革。 他们选择了五个最具可行性且对开发成本、时间周期和成功概率产生最高潜在影响的因素(如图1所示)。 图1临床开发中GenAI的用例优先级框架 High 监管机构提交 议定书数字化 Data分析 试验可行性和地点选择 临床试验设计 可行性 招聘, 保留,辍学 数字双胞胎 Low 虚拟试验 LowHigh 影响 优先使用案例其他用例 列表并不详尽。注:ZS分析资料来源: 受访者将五个开发过程分为三个优先顺序组: –圣杯(HolyGrail)——临床试验设计:使用生成性人工智能优化临床试验设计可以显著缩短临床开发时间和降低成本。然而,衡量投资回报率 (ROI)将极具挑战性,因为无法实际运行对照试验——一个基于传统方法,另一个则采用预测性AI设计。进一步的挑战在于,试验设计是最复杂且相互关联的应用场景之一,需要进行细致复杂的决策过程。 可以节省大量的时间和金钱。准确性将是至关重要的,因此需要正确调整模型。 –进化而非革命—患者招募、保留和脱落预防 ;数据分析;以及临床预测AI已经带来了 运营:通过提升效率试验可行性、选址、临床运营和数据分析。AI生成的算法将增强传统算法,标志着复杂性的提升而非颠覆性的革命。 -低垂的果实-监管写作监管提交提交: traditionally为手动过程,耗时数周到数月,并且在整个临床开发周期中需要数百至数千小时的工作。6自动化此过程 访谈对象认为监管提交和临床试验设计是最佳起步点。这些应用场景既包括快速见效的领域(如监管提交),也包括高投资回报率的领域(如临床试验设计)。但要充分发挥人工智能和通用人工智能在革新临床开发方面的全部潜力,制药公司必须在整个五个阶段进行全面演进。 1圣杯:临床试验设计 可行性介质 影响High 大约60%的试验方案需要至少一个修改,7其中近一半被认为是“可避免的”。可避免的修正案每年使制药公司损失20亿美元8在直接成本方 面,修正案平均增加了260天的开发时间表。9 这些成本最终由患者和支付方承担,而患者则需 要更长的时间才能获得创新疗法。同时,临床研 时间跨度长(5年以上) 究团队花费高达他们时间的30%用于相关工作。1 0 进行试验,一些劳动密集型任务占临床试验预 算的25%。11 Barriers 缺乏数据共享和数据质量的标准基础设施和规范。缺乏促进数据共享和生态系统协作的激励机制。倾向于传统方法而非未经测试的方法。 最大解锁 医疗生态系统各参与方的合作以一致确定AI在临床试验方案设计中的角色并改变行为。 今天试用设计 试验方案概述了研究的目标、设计、方法学、纳入和排除标准、临床终点、统计考虑因素、执行计划等内容。它们比任何其他因素更能决定一项试验的成功或失败。 GenAI增强的试验设计 在未来,团队将利用生成式AI从以往协议和之前的临床试验结果、真实世界数据(RWD)、监管先例和指导文件、患者和站点反馈等未结构化数据中挖掘信息。他们将使用这些信息来开发试验概念和计划,设计关键统计要素,优化协议并模拟场景以辅助设计决策。随着时间的推移,试验团队将利用生成式AI创建数字终点和替代终点、合成对照组以及仅通过计算机模拟进行的虚拟临床试验。生成式AI将通过利用未结构化数据增强预测能力,并通过自动化传统手动流程来简化试验设计和协议起草工作,从而减少错误、消除重复工作 、减轻行政负担并加速试验启动。 今天,设计过程复杂且效率低下,受到手动工作流的拖累,并依赖于历史数据和主观判断。结果 :导致亚最优的设计方案、较长的周期时间、高昂的研发成本以及更高的失败概率。 在临床试验设计方面,AI可以通过分析类似研究中的纳入和排除标准、预测患者特征并确保这些标准具有可行性来发挥作用。这可以防止因设计的试验与可用的患者群体不符而产生的问题,从而避免后续的修改并节省时间。 GavinCorcoran,编队生物首席开发官 用例 InsilicoMedicine 总部位于美国的生物技术公司InsilicoMedicine开发了inClinico,12一个旨在预测临床试验结果的AI平台,并与多家制药公司合作以提高药物开发效率。inClinico利用多模态数据——包括组学、文本、临床试验设计参数和小分子特性——来预测二期临床试验的成功或失败。为了验证其模型,inClinico 预测二期临床资产的结果准确率约为80%。以如此高的准确率预测临床试验结果可以帮助制药公司优先考虑最有可能成功的治疗项目,并优化投资决策,从而减少失败试验相关的成本 ,并提高制药研发(R&D)的效率。 2进化,而不是革命:试验可行性和选址 可行性介质影响高 时间范围 中等(2-4年) Barriers 数据碎片化和缺乏标准化的数据及数据共享实践 。涉及患者数据隐私和安全的监管要求。由于协议设计不佳导致的频繁协议修改。 今天,评估试验可行性及选择试验现场通常依赖于有限的数据,这一过程往往是随机进行的。试验现场的选择基于过去与试验现场的合作经验,使用诸如场地容量和历史入组率等指标。这往往忽略了与适宜性有更强相关性的现场特征,例如当地患者人口统计学特征、疾病流行率以及特定于该试验的现场能力。不完整的现场资料档案、数据孤岛以及缺乏实时访问数据的能力使基于数据的决策变得复杂,导致入组不足、成本高昂的延迟以及不可靠的可行性判断。 最大解锁 协作努力以开发稳健的数据集成标准并增强监管框架。试验设计过程的优化导致协议修改次数减少。 今天试用可行性和选址 临床试验日益复杂,使得评估试验可行性变得越来越困难。实际患者招募速度往往比预期慢,通常会比计划时间延长1.8倍。13由于入组不足,大约85%的临床试验受到影响。每延迟一天完成患者入组期限,将导致约60万至800万美元的额外成本。14 错过了市场机会。 GenAI增强了试验可行性和选址 生成性人工智能可以分析非结构化数据,包括过往试验的操作数据以及实时的真实世界数据(RWD),以供预测未来结果的模型使用,并据此进行研究现场的选择和可行性规划。通过将生成性人工智能与预测性人工智能相结合,试验规划者能够准确预测各研究现场的患者招募潜力;基于最新的多维度数据提出最优的研究现场建议;并提前预见潜在的招募挑战。生成性人工智能还将使现场规划者能够模拟各种情景,探索不同现场配置及其预期的患者招募和留存效果。此外,生成性人工智能还可以支持分散式试验,这是行业的一项关✃举措,旨在使试验更加以患者为中心,通过管理使用更多研究现场和研究调查者的物流来实现这一目标。 对于试验设计、操作和选址而言,自然语言数据的结构化与分析带来了很大的潜力… …特别是在能够对自然语言数据进行组织和分析的情况下。 AndrewGiessel,Moderna人工智能工程执行总监 用例 Amgen 安进是一家总部位于美国的生物技术公司,它开发了一种人工智能驱动的工具,它被称为分析试验优化模块(ATOMIC)。15它旨在通过结合经典方法