合成生物学掀起生物制造业革命 二战前后聚合物技术引发制造业革命,合成纤维、塑料等众多石油化工制品相继实现了商业化,至80年代后聚合物产品商业化速率已明显放缓;而自20世纪50年代DNA双螺旋结构发现以来,生物技术持续发展、突破并不断成熟,合成生物学作为最新一代生物制造技术,正推动新一轮制造业革命。 随着技术发展,“设计-构建-测试-学习(DBLT)”以及工程化为主要内容的合成生物学体系成本快速下降,技术进步令合成生物学成本快速下降,成本下降的“骑士法则”带来生物制造革命的信号。 未来5-10年内,制药、肉类、化妆品、非处方药、化学品、纺织品、非肉类食品、农业等领域将受到合成生物学的较大冲击;在更远期的未来,合成生物学有望在矿业、燃料、发电、建材、机械等领域实现颠覆性革新。 AI赋能合成生物学加速产业革新 AI技术于合成生物学产业发展大有裨益,并由此衍生bio-AI。Bio-AI可结合环境、公开数据、实验数据进行结果预测,而不是简单的试错分析,大幅增效并降低算力依赖。当前AI技术的应用已经从合成生物学的“学习”阶段向外延伸,逐渐应用于整个“DBLT”循环及工程化全流程。 Bio-AI模型培育达到一定程度或涌现从“猿”至“人”的跨越,最终构建一位基于人工智能的“合成生物学家”,大幅提升目标工程菌株构建和目标产物规模生产的速率。在此过程中,Bio-AI系统的核心差距或在于数据的积累,先发者优势明显。 Bio-AI不等同于传统的CADD技术 AI与CADD(计算机辅助制药)存在密切联系,但分别关注不同的技术范畴和应用领域,但AI的发展可强化CADD技术手段,加速新药研发过程。 投资建议 站在合成生物学产业快速发展的当口,觉察“骑士法则”的产业信号,合成生物学正推动新一轮制造业革命;AI技术突破性进展进一步加快了生物制造产业革新的步伐,Bio-AI模型大幅提升了合成生物学系统全流程的效率和潜力,高质量数据库的积累逐渐成为产业竞争的关键,而部分合成生物学的企业已具备较好的先发优势。鉴于此,建议关注合成生物学平台型企业嘉必优、华恒生物、凯赛生物,关注益生菌制品明星企业科拓生物。 1.合成生物学掀起生物制造业革命 20世纪50年代聚合物技术引发制造业革命以来,合成纤维、塑料等众多石油化工制品相继实现了商业化,80年代后聚合物产品商业化速率已明显放缓;而自20世纪50年代DNA双螺旋结构发现以来,生物技术持续发展、突破并不断成熟,合成生物学作为最新一代生物制造技术,正在推动新一轮的制造业革命。 1.1.世界工业演变:电化学-石油化工-合成生物学 19世纪60年代,诺贝尔公司硝酸甘油炸药的应用促进了有机化工业的发展;从18世纪伏特发明第一个化学电池以来,科学家通过实验不断分离出化学物质,1890年,电解法制取氯气和烧碱的方法诞生,电化学工业就此兴起,主要用于无机化合物的制备,到19世纪末,美国氨基氰等公司已经在电化学工业领域建立了丰富的产品系列。 20世纪20年代,以石油为原料的化学工业逐渐从美国萌生;30年代,催化裂化工艺的出现,开创了石油化工新的历史时期;二战前后,石油化工得到迅速发展,50年代在欧洲继起,60年代进一步扩大到日本及世界各国,世界化学工业的生产结构和原料体系也随之发生了重大变化,并催生了许多新工艺与新产品,至70年代,美国石油化工生产的各种产品数目达数千种。而从80年代以来,石油化工业逐渐遇到瓶颈,石油化工新产品的出现趋于渐缓。 合成生物学(Synbio)是一门新兴的交叉学科,通过工程生物学、系统生物学和生物信息学等学科的融合,以实现生物系统的设计和改造为目的。自20世纪50年代DNA双螺旋结构发现以来,生物技术持续发展、突破并不断成熟,合成生物学作为最新一代生物制造技术,正在推动新一轮的制造业革命。 20世纪70年代以来,合成生物学又经历了几个重要成长阶段: 1.基因工程时代(1970-1990):这一时期的研究主要集中在基因的克隆和表达,为后续的合成生物学奠定了基础。 2、生物信息学和基因组学时代(1990-2000年代):随着计算机科学和测序技术的飞速发展,研究者开始利用大量基因组数据进行生物系统的研究。 3、系统生物学时代(2000-2010年代):通过对基因、蛋白质和代谢物等生物组学数据的整合,研究者开始构建生物系统模型,并试图理解生物系统的调控机制。 4、合成生物学时代(2010年至今):通过对生物系统的设计和改造,实现对生物系统功能的定制和优化,为生物技术和生物产业的发展提供了新的动力。 图表1:合成生物制造技术示意图 图表2:合成生物学赋能解决资源问题 1.2.合成生物学掀起制造业革命 经过20、21世纪几十年的理论知识和技术积累,近年来合成生物学技术快速发展,并逐渐掀起了新一轮的制造业革命。 “设计-构建-测试-学习(DBLT)”以及工程化形成了合成生物学体系,设计阶段重点在于基因测序并根据基因测序和现有模型数据进行遗传代谢途径设计;构建阶段主要是用CRISPR等技术对细菌或真菌的DNA进行定制;测试阶段采用高通量技术“酿造”特定细胞并进行测试筛选;学习阶段则通过机器学习(ML)或人工智能(AI)来进行数据收集完善数据模型,并进入下一轮数据迭代。 合适的工程菌将被用于工程放大,用以规模生产目标产物;工艺的放大对企业生物发酵工艺的积累存在一定的考验。 随着CRISPR-Cas9等剪切技术的不断迭代,高通量技术、高通量筛选等技术的不断突破,以及AI/ML等学习技术的不断应用,合成生物学的成本快速降低,与此同时,生物制造的潜力迅速打开。 图表3:合成生物学工程化的过程示意图 技术进步令合成生物学成本快速下降,“骑士法则”带来生物制造革命的信号。 在人类基因组计划中测序和组装的成本估计在5-10亿美元,随着过去的20年DNA测序和合成技术进步,如今同等工作的成本不到1000美元。合成生物学和计算机产业在成本、可编程性(本质是AGCT碱基对的排序)和可扩展方面日益相似。 合成生物学的成本的快速下降与半导体行业的摩尔定律相似,Ginkgo Bioworks将之称为“骑士法则”或“Knight’s law”,是生物制造革命即将到来的信号。 图表4:基因测序成本下降曲线比摩尔定律更陡峭 图表5:细胞编程的修饰成本每年快速下降 生物制造业潜力很大,用途非常广泛,有望对诸多行业造成颠覆性革新。根据上海市生物工程学会数据,站在22年末的时间节点,未来5年内合成生物学有望在生物制药、肉类和水产养殖、化妆品、非处方药等领域取得较大突破;5-10年内化学品、纺织品、非肉类食品、农业等领域将受到合成生物学的较大冲击;在更远期的未来,合成生物学有望在矿业、燃料、发电、建材、机械等领域实现颠覆性革新。 图表6:合成生物学对不同行业的预计影响时间 2.AI赋能合成生物学加速产业革新 AI技术对合成生物学产业发展具有重要的推动作用,尤其AI可结合环境、公开数据、实验数据进行结果预测,而不是简单的试错分析,增效的同时降低了算力依赖。 当前AI技术的应用已经从合成生物学的“学习”阶段向外延伸,逐渐应用于DBLT循环及工程化全流程。 Bio-AI模型培育达到一定程度或涌现从“猿”至“人”的进化,并随着算法的优化减低对训练的算力依赖,最终构建一位基于人工智能的“合成生物学家”,大幅提升目标工程菌株构建和目标产物规模生产的速率。在此过程中,Bio-AI系统的核心差距或在于数据的积累,先发者优势明显。 2.1.AI给合成生物学带来发展新机遇 OpenAI公司的Gpt-4引发人们对人工智能(AI)的关注,AI技术的快速发展对合成生物学领域大有裨益,甚至由此衍生了智能合成生物学(bio-AI)。 Bio-AI是人工智能与合成生物学的融合,其将传统费时费力、周期长、依赖实验人员操作水平的生物合成过程,转化为智能全自动一体化生物合成流程。 起初,合成生物学领域的AI技术主要实践于“学习”阶段;逐渐地,AI技术的影响已经延伸至整个DBLT循环,并且在工程放大等领域有望发挥重要作用,从而大幅度提高合成生物学的效率。 图表7:基于人工智能的“类合成生物学家”概念图 具体地,AI对合成生物学的基因编辑效率、代谢途径优化、生产过程优化、蛋白质设计等方面均具有较大提升作用: 1)提高基因编辑的精度与效率:AI在基因编辑中的应用主要体现在提高编辑效率、减少非特异性剪切和预测编辑结果等方面。通过利用机器学习技术,可以训练模型来预测CRISPR-Cas9等基因编辑工具的活性和特异性,并指导合成生物学家选择更合适的sgRNA序列,以达到更高的编辑效率和减少副作用。同时,AI可以分析已有的基因编辑实验数据,从而为未来的实验提供更准确的预测和指导。 2)指导蛋白质设计:AI在蛋白质设计领域的应用主要集中在预测蛋白质三维结构、设计具有特定功能的蛋白质以及优化蛋白质的稳定性和生物活性等方面。通过深度学习技术,如AlphaFold等模型,可以预测蛋白质的三维结构,为合成生物学家提供有关蛋白质功能的信息。此外,AI可以用于蛋白质亲和性设计,通过优化蛋白质与目标分子的相互作用,提高蛋白质的生物活性。这些技术在药物设计、生物传感器和工业酶等领域具有重要应用价值。 3)优化代谢途径与生物生产过程:AI在代谢工程领域主要用于优化代谢途径、调控基因表达以及预测微生物生产性能等方面。利用机器学习技术,可以构建代谢网络模型并预测基因敲除或过表达对产物产量的影响。这有助于研究者筛选和优化生产菌种,提高生物制品的产量和纯度。此外,AI还可以指导合成生物学家进行基因调控元件(如启动子、核糖体结合位点等)的设计,以实现对生物系统功能的精细调控。 图表8:AI技术解决生物工程领域一些挑战的潜力生物工程的挑战关键AI技术 不仅如此,AI还可帮助优化发酵过程与放大过程,环境因素和细胞代谢之间具有复杂的相互作用关系,传统的发酵放大方法是利用统计学方法结合反复试错及发酵工程师经验;而借助人工智能技术,利用微型反应器集群形成的海量发酵过程数据,结合实验设计理论,可更高效地实现发酵菌种验证、发酵工艺开发等工作,大幅缩短合成生物学创新菌种从实验室走向工业化的时间。 尤其地,AI可以帮助合成生物学克服一个基本挑战,即预测生物工程方法对宿主和环境的影响。此前合成生物学由于无法预测生物工程的结果,即使结合计算机辅助也只能通过大量的试错来实现工程目标,并消耗大量算力资源,但AI提供了利用公开数据和实验数据来预测对宿主和环境影响的机会,让合成生物学发展进入新阶段。 图表9:2005—2021年人工智能应用于合成生物学的代表性进展 总之,AI在合成生物学领域的应用涉及基因编辑、蛋白质设计和代谢工程等多个方面,这些技术为合成生物学的研究提供了强大的支持,有助于加速实验进程、提高研究准确性和降低研发成本。随着AI技术的不断发展和进步,可以预见AI将在合成生物学领域发挥越来越重要的作用,推动该领域的创新和突破。 2.2.高质量数据为bio-AI的发展关键 人工智能(AI)、机器学习(ML)和深度学习(DL)属不同概念,之间为从属关系。人工智能(AI)属于概括性术语,包含机器学习技术,而深度学习是机器学习的一种类型。 DL是机器学习(ML)的一个子集。深度学习使用神经网络以更高的精度学习、理解、解释和解决关键问题,让计算机解决更复杂的问题,获得更准确的结果。相较于ML,DL可以自动确定用于分类的特征,因而可以理解细微的差异,而ML需要手动理解这些特征。不过DL需要大量的深度学习训练数据才能给出更准确的结果。 图表10:ML、DL为AI细分技术 图表11:ML、DL属于AI技术范畴 AI作为一个广泛的概念,本质是用数据和模型去为现有的问题提供解决方法。 在合成生物学领域,无法仅用ML或DL代表AI,Bio-AI更应该如一位基于人工智能的“类合成生物学家”。在实践中,我们希望bio-AI可以像有智力的人一样地处理工程任务