AI技术已从语言对话端切入制药领域。ChatGPT是一种OpenAI训练的对话式大规模语言模型,用时两月用户数目已达到了1亿人次,反响火爆。语义型AI目前除搜索聊天外,正逐步在药物研发中发挥作用。 OpenAI技术有望成为蛋白药物发现领域的“颠覆者”。AI在医药领域应用大致分为三个阶段,(1)AI影像识别(2)蛋白结构识别(3)蛋白结构生成。 Progen模型颠覆性的改变了传统蛋白类药物设计过程,过往的蛋白优化通常仅是对天然蛋白的“微调”,而深度学习创造的蛋白质则与天然蛋白大部分序列均不相同。传统蛋白药物依赖对天然蛋白质进行随机的氨基酸突变及优化,AI技术将直接模拟合成及预测从未发现的结构,极大扩展初始蛋白结构库。目前已有众多公司布局AI辅助医疗,新药筛选以及创新药物研发,同时以谷歌,Meta为代表的互联网巨头开始进入AI制药领域。 投资建议:目前以类“OpenAI”蛋白质深度学习语言模型正逐步改变蛋白药物早期研发过程,关注AI辅助医疗行业公司,如嘉和美康,鹰瞳科技,早期AI新药筛选公司,如药石科技,成都先导,维亚生物。 风险提示:政策风险,产品研发进展不及预期风险。 重点公司盈利预测、估值与评级 1AI技术不仅用于对话,已在药物发现展现潜力 1.1ChatGPT会改变生物医药吗? ChatGPT:一种大型的语言模型,用于对自然语言输入进行建模和预测,能够回答人类的问题并进行自然对话。 TikTok达到1亿用户用了9个月,Instagram则为2年半;iTunes用了6年半、Twitter用了5年、Facebook用了4年半。在ChatGPT身上,这个成绩仅仅用了两个月。ChatGPT又会如何影响医药行业呢? 图1:ChatGPT搜索指数 1.2语言模型将AI医药应用从简单识别推向“创造药物” 目前AI在医药领域的应用大致分为三个阶段, (1)第一阶段是AI影像识别,运用计算机视觉、深度学习等人工智能技术,对内窥镜、钼靶、超声、 Ct 、MRI、病理、眼底照相、OCT等各类医学影像进行学习训练,能够有效辅助医生诊断和重大疾病的早期筛查等任务。 (2)第二阶段以AlphaFold为代表,使用蛋白质数据库中接近17万个不同的蛋白质结构,以及包含未知结构的蛋白序列数据库对AlphaFold进行训练。通过不断地迭代,AlphaFold系统学习到了基于氨基酸序列,精确预测蛋白结构的能力。 (3)第三阶段以目前类“OpenAI”的语义识别系统(如ProGen),可以通过简单指令创造出自然界未有的结构。ProGen通过学习在给定原始序列中过去的氨基酸的情况下,预测下一个氨基酸的概率来迭代优化,没有明确的结构信息或成对协同进化假设。 图2:AI医药领域应用 2OpenAI技术有望成为蛋白药物发现领域的“颠覆者” Progen模型颠覆性的改变了传统蛋白类药物设计过程,过往的蛋白优化通常仅是对天然蛋白的“微调”,而深度学习创造的蛋白质则与天然蛋白大部分序列均不相同。 图3:传统蛋白药物设计与Progen蛋白设计差异 传统蛋白药物依赖对天然蛋白质进行随机的氨基酸突变及优化,AI技术将直接模拟合成及预测从未发现的结构,极大扩展初始蛋白结构库。目前已有众多公司布局AI辅助医疗,新药筛选以及创新药物研发,同时以谷歌,Meta为代表的互联网巨头开始进入AI制药领域。 图4:AI医药领域应用(不完全统计) 3投资建议 目前以类“OpenAI”蛋白质深度学习语言模型正逐步改变蛋白药物早期研发过程,关注AI辅助医疗行业公司,如嘉和美康,鹰瞳科技,早期AI新药筛选公司,如药石科技,成都先导,维亚生物。 表1:医药行业重点公司盈利预测、估值与评级 4风险提示 1)政策风险。在AI领域的政策变动可能导致其医药领域使用受限的风险。 2)产品研发进展不及预期风险。医药AI应用属于高新技术领域,存在其技术进步未达预期的风险。