中国AI制药企业白皮书丨2023/11 2023 中国AI制药企业白皮书 WhitePaperonChineseAIPharmaceuticalEnterprises 成都高投生物医药园区管理有限公司药融云数字科技(成都)有限公司总编辑:王中健 2023年11月30日 2 免责声明 DISCLAIMER 本报告基于本公司(药融云数字科技(成都)有限公司)及其研究人员认为可信的公开资料和文献,反映了研究人员的研究观点,结论不受任何第三方的授意或影响。但本公司对这些信息的真实性、准确性、可靠性和完整性不作任何保证,且本报告中的资料、意见、预测均反映报告初次公开发布之前的判断,可能会随时调整。本公司可在不发出通知的情形下对本报告所含信息做出修改,读者应当自行关注相应的更新或修改。 本报告所有的信息或观点仅作为读者的参考,不构成任何投资、法律、会计或税务的建议,也不构成任何广告或要约。在任何情况下,本公司不对任何人因使用本报告中的内容所致的损失承担任何责任。 本报告相关的知识产权归本公司所有。未经本公司事先授权,任何人不得对本报告进行任何形式的翻译、发布或复制。如需引用,应注明出处为“药融云数字科技(成都)有限公司”以及“中国AI制药企业白皮书”名称,且不得对本报告进行有悖原意的删节或修改。如需联系本公司,请联系:yangjianyun@bcpmdata.com。 副主编:赖庆刚李亚玲杨建云 编写专家:王婷衡星黄镕梁崇晟版面设计:陈悦 2023年11月 3 编制说明 作为近年来技术变革的重要力量,AI在生物医药领域展示了极大的应用潜力。国家发改委2022年发布的《“十四五”生物经济发展规划》提出,要利用云计算、大数据、人工智能等信息技术,对治疗适应症与新靶点验证、临床前与临床试验、产品设计优化与产业化等新药研制过程进行全程监管,实现药物产业的精准化研制与规模化发展。随着AI浪潮席卷全球,生物制药也被视为大模型有望率先落地的场景之一。 基于此,2023年10月,成都高投生物医药园区管理有限公司联合药融云数字科技(成都)有限公司,共同编写了《中国AI制药企业白皮书》,希望为业界厂商、政府机构等相关方提供有益思考,共同推动产业高质量发展。 由于时间仓促,水平所限,我们的工作还有不足之处。下一步,我们还将广泛采纳各方面的建议,进一步深入相关研究,持续完善白皮书内容,在已有版本的基础上,适时修订发布新版。 出品方:药融云数字科技(成都)有限公司成都高投生物医药园区管理有限公司 总编辑:王中健 副总编辑:肖海波戴祁江丹责任编辑:张祯杰 执行主编:王婷 中国AI制药企业白皮书丨2023/11 4 中国AI制药企业白皮书丨2023/11 5 目录 第一章人工智能(AI)制药行业概览 人工智能的基本概念09 AI制药是AI产业化中重要的应用场景10 AI制药行业发展历史11 AI制药行业配套政策分析13 AI制药行业投融资现状分析14 第二章AI+药物发现 AI助力药物发现阶段概览16 AI助力药物靶点发现与验证16 AI驱动药物分子设计、优化23 AI辅助药物分子筛选34 第三章AI+临床前研发 AI助力药物临床前研发概览38 AI辅助药物理化特性预测38 AI辅助药物剂型设计39 AI助力药物ADMET性质预测40 AI+临床前研发国内企业布局42 第四章AI+临床研发 AI助力新药临床试验概览46 AI助力受试者招募管理50 AI助力预测临床试验效果53 AI助力临床试验数据管理57 AI赋能药物注册申报59 第五章AI+药物生产及商业化 AI赋能药物生产支持61 AI赋能药物市场开拓与商业化65 AI逐步应用于药物警戒领域67 第六章AI制药行业总结及未来展望 现状分析及展望70 上市企业商业化模式73 全球主要AI制药上市企业74 报告缩略词中英文对照表 英文缩写 英文全称 中文译文 AI ArtificialIntelligence 人工智能 AIDD ArtificialIntelligenceDrugDiscovery&Design AI制药 CADD Computer-aidedDrugDesign 计算机辅助药物设计 SBDD Structure-basedDrugDesign 基于结构的药物设计 HTS High-throughputSequencing 高通量测序 ML MachineLearning 机器学习 DL DeepLearning 深度学习 RL ReinforcementLearning 强化学习 TL TransferLearning 迁移学习 NLP NaturalLanguageProcessing 自然语言处理 GAN GenerativeAdversarialNetworks 生成对抗结构 RNN RecurrentNeuralNetwork 循环神经网络 VAE VariationalAutoencoder 变分自编码器 SMILES SimplifiedMolecularInputLineEntrySystem 分子反应的线性符号 DTI DrugTargetsInteractions 药物-靶标相互作用 GPT GenerativePre-TrainedTransformer 生成式预训练Transformer模型 CSP CrystalStructurePrediction 晶型预测 ADMET Absorption、Distribution、Metabolism、Excretion、Toxicity 药物吸收,分配,代谢,排泄和毒性 QSAR Quantitativestructure-ActivityRelationship 定量结构活性关系 PK Pharmacokinetics 药代动力学 PLM ProteinLanguageModel 蛋白质语言模型 人工智能(AI)制药行业概览 8 01 第一章 人工智能的基本概念 人工智能(ArtificialIntelligence,AI),是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。 人工智能是一个广泛的领域,包括专家系统、多智能体系统、进化计算、模糊逻辑、机器学习、知识表示、推荐系统、自然语言处理系统和计算机视觉等多个方面。其中,机器学习技术是应用最广泛的一种技术,具体包括以下几种方法:监督式学习、无监督式学习、半监督学习、集成学习、深度学习、强化学习、回归分析、分类聚合、量度学习、因果关系等。各类机器学习技术在各个领域都有广泛的应用,推动了人工智能的发展和应用。 人工智能作为新一轮产业变革的核心驱动力,将进一步释放历次科技革命和产业变革积蓄的巨大能量,并创造新的强大引擎,重构生产、分配、交换、消费等经济活动各环节,形成从宏观到微观各领域的智能化新需求,催生新技术、新产品、新产业、新业态、新模式,引发经济结构重大变革,深刻改变人类生产生活方式和思维模式,实现社会生产力的整体跃升。 人工智能 图表1实现人工智能的主要技术汇总[1] 机器学习 专家系统 多智能体系统 进化计算 模糊逻辑 知识表示 推荐系统 自然语言处理系统 计算机视觉 监督式学习 无监督式学习 半监督学习 集成学习 深强回分量因度化归类度果学学分聚学关习习析合习系 [1]整理自药融咨询 AI制药是AI产业化中重要的应用场景 AI制药(AIDD)是指利用AI技术在药物研发、药物设计、药物筛选、临床试验和药物生产等各个环节中应用的制药领域。AI在药物研发中可以通过数据挖掘、机器学习和深度学习等技术,加速药物发现和设计过程,提高研发效率和成功率。AI还可以在药物筛选中帮助挑选出具有潜在疗效的候选药物,降低研发成本和时间。在临床试验中,AI可以帮助优化试验设计、招募适合的患者群体,并提供数据分析和预测,加快药物上市进程。此外,AI还可以应用于药物生产中的质量控制、流程优化和智能化管理等方面,提高药物的生产效率和质量。 图表1AI技术在药品全周期中的主要应用 AIDD主要优化环节 药物发现 临床前研发 临床开发 上市后 靶点 蛋白 发现 药物 结构设计 理化 性质 预测 晶型 预测 临床 试验 设计 智能 注册 平台 生产 工艺 优化 药物 安全 警戒 靶蛋 白结构预测 药物 合成路线设计 药物-蛋白相互 作用预测 生物 活性预测 剂型开发 受试 者筛选 质量 保证和控制 毒性预测 临床 结果预测 智能 化管理 随着AI技术的发展,AI技术基本实现了药物研发与市场化全流程的覆盖,特别是在药物发现和临床前阶段取得了显著进展。药物发现和临床前研发阶段是AIDD的主要优化环节,也是AI制药企业主要的研发及商业化方向。利用AI技术,企业能够在药物发现和临床前研发阶段,节约大量湿试验成本与时间成本,并实现高通量筛选,助力更多新靶点的发现与“老药新用”的适应症拓展。未来AI技术将持续发展,相信能够在药品临床开发、上市后生产与商业化等方面更进一步。 AI制药行业发展历史 图表1AIDD行业发展历程[1] 7,000 全球AI制药相关论文发表数量中国AI制药相关论文发表数量 1981-2012:CADD辅助药物研发2012-至今:AIDD高速发展 6,500 6,000 5,500 5,000 4,500 2022年 AlphaFold能够测所有已分类 蛋白质的3D结构 人工智能概念首次提出(1956年)机器学习技术发展,AI技术水平提升(1970年) 2012年 第一家AI用于药物研发商业化公司成立 2000年 CADD软件已成为药企必不可少工具 2021年 全球第一种完全由AI设计和研制药物进入临床 4,000 2023年 赛诺菲宣布“AllIn”人工智能和数据科学 3,500 2006年 •深度学习概念提出,AI技术水平进一步提 升 1981年 CADD正式面世 1996年 第一款基于SBDD研发的药物上市 3,000 2,500 2,000 1,500 1,000 500 0 19801982198419861988199019921994199619982000200220042006200820102012201420162018202020222024 纵观AIDD行业的发展,主要分为3个时期: 1956年~1981年的技术积累期,该时期是相关概念的早期构想阶段,但由于技术限制未能成功实施; 1981年~2012年计算机辅助药物设计(CADD)研发时期,CADD的虚拟筛选,可用于寻找有希望成药的苗头化合物进行药物开发,但CADD是药物发现过程的支持部门,而不是核心部门。CADD仅缩短药物发现时间,受限于工艺优化、临床、注册等环节,新药数量并未出现激增。 图表2FDACDER批准新药数量统计 NDABLA总计 10 8 6 4 2 0 19841986198819901992199419961998200020022004200620082010201220142016201820202022 [1]数据来源自WebofScienceScienceCitationIndexExpanded数据库 2012年~至今的AIDD高速发展期,该时期迎来的AI技术的“井喷式”发展,AIDD相关论文数量迎来“指数级”增长,相关技术栈逐步丰富完善。 在药物发现及临床前研究阶段,基于从前的CADD技术,结合人工智能、机器学习和深度学习等技术,可以处理大 量的生物数据,从而在药物开发全过程中减少时间和成本。 图表1AIDD有效减少药物发现及临床前研究时间[1][2][3] 项目开始至专利获批专利获批至临床阶段 药物发现到临床实验制药行业平均研发时长[2] RLY-1971RLY-4008EXS-21546PHI-101DSP-1181