合成生物学——建物致知,大有可为 西南证券研究发展中心 2022年8月 分析师:杜向阳执业证号:S1250520030002电话:021-68416017 邮箱:duxy@swsc.com.cn 核心观点 合成生物学发展经历了四个阶段。2005年以前:技术发展初期,代表成果为青蒿素前体在大肠杆菌中的合成。2005—2011年:基础研究快速发 展,工程化理念日渐深入、使能技术平台得到重视、工程方法和工具不断积淀的阶段,体现出“工程生物学”的早期发展特点。2011—2015年 :基因组编辑效率大幅提升,下游应用领域开始不断拓展。2015年以后:“设计—构建—测试-学习”概念提出,多学科融合程度加深,叠加资 本市场加速入场,行业进入加速发展期。 多环节高技术壁垒,国内外差距不大,国内企业存在弯道超车可能。合成生物学在基因设计、菌株改造、产物功能性质的鉴定、分离纯化、放大量产等方面存在多学科知识交叉,需要企业长时间经验积累,目前国内外尚未出现真正的合成生物学领军者,国外纳斯达克上市公司如Amyris、GinkgoBioworks市值均在50亿美元以下,国内企业通过产学研或自主研发的形式,有望实现弯道超车。 政策、技术、资本三重加持下,行业市场规模24年超千亿,医药领域占比约3成。1)政策端:合成生物学发展符合我国“双碳”目标的实现,与传统技术路线相比,更环保、成本优势更明显。且属于创新型技术,是我国未来生物科技发展的重点技术项目。2)技术端:基因测序技术发展迅速,检测时间和单位成本明显下降。国内企业使能技术、生产Knowhow技术已经积累到一定阶段,在产品商业化方面逐渐放量。3)资本端 :2018年创下融资金额23亿美元的融资记录。资本和市场的目光正在向合成生物的技术应用层面聚集。从投资领域来看,主要集中在医疗、食 品及饮料开发、生物体设计、自动化生产平台及能源应用开发等。根据CBInsights数据,预计到2024年合成生物学市场规模达到189亿美元 。从CAGR来看,预计食品饮料、农业领域的增速最快,分别为64.6%/64.2%。从占比来看,医疗健康领域预计2024年市场规模为50亿美元左右,占到整体市场规模的27%。 选品视野和产业化能力是核心竞争力。通过复盘海外Amyris等公司发展路径,我们认为,考验公司立项的前瞻性视野尤为关键,对于产品的市场前景(景气度、成熟度)、可替代性(成本、环保)、产业放大难度(早期菌株选择、后期纯化量产)等方面的判断是决定公司未来发展的核心。目前来看,合成生物学选品仍以自下而上的方式为主,主要集中在化工能源、医药、食品领域较多,未来随着与计算机科学的深入研究 ,合成生物学有望创造新需求。建议重点跟踪企业早期项目布局及进展,同时关注上市后产品验证情况。 主要标的:金斯瑞(底层技术实力强劲)、诺唯赞(酶试剂龙头企业)、华熙生物、华东医药、凯赛生物(长链二元酸龙头企业)、华恒生物 (L-丙氨酸等氨基酸龙头企业)、金城医药等。 风险提示:选品失败的风险;研发失败的风险;产品销售或技术服务销售不及预期的风险。 1 1.1合成生物学含义 合成生物学——“建物致知”:是指在工程学思想指导下,按照特定目标理性设计、改造或者从头重新合成生物体系,即生物学的工程化,涉及生物学、生物信息学、化学、计算机科学等多个学科的交差。简单来说就是通过DNA基因层面的设计通过多组学方法生产想要的各类产物。 要解决的主要技术:1)关键元件(DNA序列)的挖掘/合成;2)底盘细胞的优化(菌株的选择及改造);3)代谢途径/基因表达途径的构建和产物鉴定;4)如何分离纯化以及放大生产。且全过程中与机器学习等算法/以及生物数据库的完备程度息息相关。 合成生物学涉及到的学科广泛 合成生物学发展要解决的关键技术 DNA设计/ 功能鉴定 底盘细胞选择/优化 合成生 物学 天然宿主改造/无细胞 体外合成 整体功能通路打通 1.2合成生物学下游应用领域多样 基于合成生物学原理以及技术方式可分为三大类型公司:1)开发使能技术,如DNA合成和测序;2)制造DNA构件及集成系统,如软件服务;3)利用合成生物学平台生产所需产品,(医疗、农业、消费品、食品饮料、能源、工业等领域)。 1.2合成生物学下游应用领域多样 不同领域关注的侧重点不同。传统化工能源、食品领域更多关注其降本增效能力,医药领域则更关心产物质量效果,如蛋白质的靶向性、成药性等指标。 吡喃香豆素3.7mg/L厦门链霉菌 天然产物 人参皂苷Rh2300mg/L酿酒酵母 应用领域 产物/疾病 产量 微生物菌种 呋喃香豆素虾青素 3.6mg/L 29.6mg/g 厦门链霉菌蓝细菌 番茄红素2.37g/L酿酒酵母 医学领域 霍乱弧菌感染 疟疾肿瘤 黑色素瘤肾衰竭乳腺癌 丁醇 - - - - - - 552mg/L 大肠杆菌 沙雷氏菌属沙门氏菌大肠杆菌埃希氏菌属噬菌体 大肠杆菌 能源领域 工业化学品 乙醇90.7g/L酿酒酵母 脂肪酸4.5g/L大肠杆菌 富马酸22.4g/L大肠杆菌 丁二酸12.51g/L嗜热厌氧杆菌 Γ-聚谷氨酸32.14g/L解淀粉芽孢杆菌苹果酸201.13g/L黑曲霉 琥珀酸134.25g/L曼海姆菌 1.3合成生物学如何选品——目前以自下而上为主,从需求、价格等维度考虑 产品立项的策略 市场需求:寻找大的存量市场中细分赛道市场天花板足够高的赛道,如某些食品添加剂产品目前只能应用成人食品中,后续品质提升后可拓展到婴幼儿食品或老人保健当中;或碳中和背景下,某些环保材料。 价格:传统领域,应用合成生物学能做到降本增效的产品。如部分氨基酸。高附加值产品,如角鲨烯、医药中间体等。 工艺可行性:一般生命体中的化合物/天然提取物的代谢途径都是经由酶催化进行的,需要寻找到相对应的功能酶,多次调试后才会立项生产。 Follow+创新:如食品添加剂、维生素等领域,国内企业一般会follow帝斯曼或者巴斯夫等国际巨头产品线,有现金流后拓展新项目。 产品立项的考虑策略 选什么 做? 存量市场大,细分赛道天花板高 赚产能的钱,国产替代 工艺可行性强 Follow和创新并存 蓝晶微生物:化工材料:2万-3万亿元规模,其中环保塑料未来10年全球规模超万亿元。 凯赛生物:聚酰胺原材料,产能3/4依赖进口, 且传统化学方法单位产量较低,成本高 已知代谢途径的化合物 食品维生素:跟随帝斯曼、巴斯夫;医药生物:自主创新,定向合成全新产物 1.4合成生物学的核心技术 基因设计是底层技术,也合成生物学发展必需技术:绝大多数具有生物活性的天然产物,决定其生物合成的众多基因元件都不清楚,因此,挖掘出合成途径中的关键基因元件尤为重要。根据一般的化学反应原理及已知的中间体结构并辅以同位素示踪,可推测可能的生物合成途径。 菌株改造:如何选择最适合的菌株,如何改造最适合的菌株。 产物功能性质的鉴定:产物种类众多,功能鉴定具有独特性,难度最大。对于遗传操作手段不成熟,难以实现(多)基因编辑的菌株,将候选基因克隆出来并在异源系统中表达,以内源产生或外源添加的办法提供底物,进而通过色谱、质谱、核磁等技术对产物进行分析鉴定,从而确定酶的催化活性是目前常用手段。 分离纯化、放大量产:从实验阶段如何扩大生产也是难点。 基于合成生物学筛选平台的基因元件挖掘路线图 高通量测序 化学分析 功能验证 底盘细胞培养 多组学分析 未来的方向:结合计算机技术建立整体流程的学习反馈机制。 1.4合成生物学的核心技术——多学科交叉,大部分企业只掌握部分能力 1.4.1基因设计——化合物代谢途径的关键酶+各类型蛋白质 生物基化学品交互式代谢全图 对代谢途径/基因表达途径的理解是基础。2022年8月10日,合成生物学知名学者,SangYupLee教授发表了一张最新的微生物可参与合成的化学品清单。汇编了目前所有可用的生物和化学反应途径,共包含有着532种化合物和580个反应,这其中生物反应和化学反应分别为438个和142个。 1.4合成生物学的核心技术——多学科交叉,大部分企业只掌握部分能力 1.4.1基因设计——化合物代谢途径的关键酶+各类型蛋白质 生物体代谢生产化合物中如何生产关键功能酶是难点:理性设计/定向进化(非理性设计)/人工智能辅助开发。 三种设计蛋白质的方法 理性设计 •限制因素:需要对结构功能信息 有深入了解,并且需要巨大的计 算资源 定向进化 •限制因素:较低的筛选速率和 序列空间中庞大的变体数量 人工智能 辅助 •学习已有数据中的信息,建立起输入属性 (如序列)到输出属性(如功能)的映射,不需要详细的物理或生物层面的基础信息。就能够通过实验中容易得到的输入值来预 测输出值,从而免除大量的重复性实验。 1.4合成生物学的核心技术——多学科交叉,大部分企业只掌握部分能力 1.4.1基因设计——如何设计机器学习的算法? 需要解决的问题 蛋白质结构预测:之前PDB数据库中可预测结构的蛋白质大约为15万种,而最近谷歌子公司DeepMind宣布其AlphaFold平台已经可以预测的蛋白质结构超过2亿,来自于100万个物种,几乎涵盖了全球上所有已知的蛋白质。其中有约35%的预测结构与实验确定的结构高度一致,除此之外,还有45%的结构是被认为有足够的可靠性,其能够用于之后的各种分析应用。 功能预测:研究者通过收集原始酶的序列信息和底物的物理化学特性(如疏水常数lgP、分子表面积)和结构信息(如官能团拷贝数、框架类型),建立了初始的数据集,并以多种基于决策树的算法来构建突变酶功能的预测模型。 AlphaFold可预测的蛋白质结构已超2亿 功能预测算法迭代 结构-功能对应关系。 信息来源:DeepMind,人工智能辅助的蛋白质工程,西南证券整理9 1.4合成生物学的核心技术——多学科交叉,大部分企业只掌握部分能力 1.4.2菌株改造与选择 底盘细胞的优势:天然产物传统的生物制造方法主要是通过微生物大规模发酵或植物栽培进而分离提取。然而,天然菌株一般生长慢、不易培养和产量低;至今仅有1%的可培养微生物,而绝大多数的生物资源并未获开发利用。底盘细胞具有遗传背景清晰、遗传操作简便、生长快、易大规模培养等优势。 改转录:拓展其启动子识别的广谱性及转录强度;使用高效的诱导表达体系;人工构建的更适合底盘的启动子 提高效率:“自上而下”,删除底盘细胞非必要基因,减少代谢负担,提高细胞活力。 “自下而上”,如酵母基因组中几条染色体已通过人工方式设计合成,并且在合成的酵母染色体中引入了SCRaMbLE系统,制造 突变库,高通量测序选择最优解。 用于生物制造的底盘细胞体系与天然宿主和无细胞体系的比较 底盘细胞 天然宿主 无细胞体系 细胞生长 快 较慢 - 遗传操作 简单 较复杂 - 合成途径 外源导入或人工改进 天然 多酶复合体系,适用于反应途径较简单的体系 活性物质合成能力 高、易改造 较低 高 分离纯化 较易 较难 易 用于营养保健领域 不宜 合适 - 1.4合成生物学的核心技术——多学科交叉,大部分企业只掌握部分能力 1.4.2菌株改造与选择 菌株改造的目的。按产物来分可以分为:1)优化天然宿主中代谢物的生产;2)通过异源生物合成途径产生非天然代谢物;3)异源蛋白质的 优化天然代谢物的策略 表达 优化天然代谢物的策略:加精华、去冗余。 1A:体内基因过表达酶,提高其活性。 1B:建立体外转运泵,及时把产物输出,提高产量。 1E:增强辅酶因子的作用。 1H:增加底物浓度。 1I:提高碳利用率 1J:通过工程信号转到控制其他影响代谢的因素 1C:去除掉一些非必要基因,提升细胞整理效率。 1D:删除可导致产物降解的基因。 1F:为扩大单位产量,消除细胞本身负反馈机制(改 造酶)。 1G