科学智能(AI4S) 全球发展观察与展望 2022版 ArtificialIntelligenceforSciences(AI4S) ——AGlobalOutlook2022Edition 2 前言:站在科学的分水岭上 “Wewantedflyingcars,insteadwegot140characters.”PeterThiel2013年在耶鲁大学演讲时说。的确,千禧年以来,海量的科学人才涌入互联网科技行业,带来生产和协作方式的变革,创造了巨量的财富。而随着互联网热潮渐渐褪去,人们重新把目光聚焦回科学本身,以及它们所映射的实体经济领域上。 科学技术是第一生产力。科技革命的历史波澜壮阔。过去三百年间,科学行进经历过数次系统性危机,正是这些危机的解决才带来了科学的突破,新科学经由新工具的应用和普及,进而带来生产力的大幅提升。时至今日,随着数字化时代的到来,科技创新转化为直接生产力的速度越来越快。与此同时,系统性危机再一次降临。抬眼望去,科技创新 与应用的上空正飘着一朵遮天蔽日的“乌云”——维数灾难。维数灾难,是1929年PaulDirac盯着一行薛定谔方程、将第一性原理了然于胸却仍然面临数学能力瓶颈时的无奈;是1957年RichardBellman写下控制论方程、却因变量太多不知如何有效求解时的挣扎;是1965年JurisHartmanis和RichardStearns面向计算机上“原则上可计算、实际上难计算”的一大类问题时的觉醒;是1972年PhilipAnderson呼吁科学内蕴层次化结构、写下“MoreIsDifferent”时的呐喊…科学家们在维度灾难面前苦苦挣扎:面对纷繁复杂的现实世界,虽然数据越来越丰富,但是寻求简单、漂亮的洞见却变得越来越 难;各行业的技术专家也深受困扰:控制和设计的自由度越来越多,“炒菜式”的试错和喊口号式的攻坚也越来越难以解决实际问题…… 此时,AI来了。从艾伦·图灵的系统思考开始,伴随着算法、算力、数据的融合发展,AI在计算机视 觉、自然语言处理,自动驾驶等同样饱受“维数灾难”的领域大放异彩。但AI若想从一套“数据处理”工 具,走向更加通用的“智慧”,则无法绕开“科学”这一人类智慧结晶中最精华的一部分。于是,一群人先行者开始探索用AI学习科学原理,解决科学问题的路径。他们发现,当下AI取得成就的本质原因是在算力和数据基础之上算法对高维函数处理能力的大幅提升,这一能力是应对当下系统性危机的关键;他们发现,AI是驱散Science各领域维度灾难的乌云的法宝,AIforScience(AI4S)会是AI的下一个主战场,它将极大地拓展Science和AI的边界;他们发现,AI4S将赋能技术和工业的方方面面,帮助我们加快走完科学研究和技术创新之间的最后一公里,也将帮助科学家从纷乱的自然和社会特征之中抽丝剥茧,发现事物背后作用着的关键规律。 AI4S的未来正在走向流行。AI求解薛定谔方程、AI求解控制论方程、AI加速分子模拟、AI预测蛋白结构、AI赋能药物和材料设计……2022年正在迎来AI4S的繁花似锦。 AI4S流行的路上也将充满挑战。它呼唤各行各业的人们打破壁垒、凝聚共识、创造连接、形成迭代。拨云见日的路上,真理与泡沫、洞见与偏见差别均在毫厘之间。站在这个科技革命的时代转角,北京科学智能研究院(AISI)与深势科技作为全世界最大AI4S开源社区DeepModeling的核心开发者及AI4S产业落地实践的先行者,与高瓴创投一起,整理了数十家领先企业和科研机构的经验方法,编写成 册。道阻且长,行则将至。希望从此,这份报告将陪伴每一个关心AIforScience的人度过每个春秋,见证这场发生在当下的科技革命,从花开花落走向硕果累累。 目录 前言:站在科学的分水岭上3 报告观点:AIFORSCIENCES十大展望10 出品团队11 第一章:AIFORSCIENCE发展历史与技术现状12 1.1AI4S的原理与现状14 1.1.1科学研究两大范式:牛顿vs.开普勒14 1.1.2科学理论与产业实践间的鸿沟——维度灾难15 I.处理海量数据的维度灾难16 II.求解复杂物理系统的维度灾难17 1.1.3AI4S的数学原理:机器学习对高维函数的有效拟合18 1.1.4AI4S的三种范式19 I.AI4S高效处理海量数据19 II.AI4S高效高精度求解复杂物理系统20 III.AI4S“模型驱动”与“数据融合”的深度融合20 1.2AI4S的组成要素:数据、模型、算法、算力、跨学科人才协作22 I.高质量实验观测与模拟数据22 II.机理驱动与数据驱动模型23 III.人工智能算法24 IV.高性能算力25 V.跨学科人才和开源协作模式26 1.3AI4S的发展与展望28 1.3.1概念导入期(2016-2021)29 表1.2016-2021AI4S代表性成果(摘选)30 1.3.2大规模基础设施建设期(2021-2026)31 1.3.3成熟应用期(2026年及以后)32 1.3.4AI4S的长期愿景是发现新的科学原理33 1.4AI4S潜在用户调研35 I.生命科学从业者调研35 II.材料科学从业者调研38 1.5学术及产业各界观点*40 第二章:AIFORLIFESCIENCE原理与实践45 2.1生命科学中的AI4S46 2.1.1生命科学走入AI时代46 2.1.2AI4S推动生物机理的探索48 表2:AI4S在多组学中的应用52 2.1.3基因+AI4S在靶标发现和精准医疗中的利用53 I.基因组学数据驱动的靶标发现53 II.精准医疗、基因治疗和核酸药物53 2.2AI4S驱动的药物研发57 2.2.1药物研发的现状与挑战57 2.2.2AI4S药物研发新范式60 表3:药物研发流程中的各步骤的挑战和AI4S范式60 I.物理模型驱动的药物研发62 II.数据驱动的药物研发63 III.物理模型和数据驱动的融合63 2.2.3AI4S在药物研发中的实践64 2.2.3.1蛋白结构解析64 I.蛋白质结构的解析曾困扰人类50年64 II.AI4S使得蛋白质结构预测成为现实64 III.AI4S助力冷冻电镜数据三维结构的自动化搭建65 IV.强化动力学用于蛋白质结构精修65 V.DNA/RNA折叠结构探索,助力药物靶点的开发66 2.2.3.2蛋白质功能机理探索和理性设计67 I.基于结构和动力学的蛋白质功能机理探索67 II.强化动力学助力蛋白动力学的发展,开发更多药物靶点67 III.AI4S助力蛋白-蛋白的相互作用(PPI)预测,推动生物大分子药物研发进程67 IV.生物大分子药物的定向优化68 V.基于性质/功能的大分子从头设计进程68 2.2.3.3AI4S驱动的药物发现和药物优化69 I.分子表征69 II.蛋白与配体亲和力评估69 III.基于靶点的分子生成71 IV.合成预测及自动化实验71 V.基于数据模型推动的ADME/T性质预测72 2.2.3.4CMC药剂学优化和合成预测73 I.AI4S应用于晶型预测73 II.AI4S在剂型预测中的使用和推动73 AI4S实践(1):DeepMind发布AlphaFold2实现对蛋白质结构媲美实验精度的预测75 AI4S实践(2):从“序列-结构”到“动力学-功能”,强化动力学帮助开发难成药靶点77 AI4S实践(3):AI4S+FEP亲和力预测达实验精度,助力药企的先导化合物优化78 AI4S实践(4):英矽智能基于端到端的AI4S平台实现”First-in-class”药物的高效研发79 2.2.3AI4S驱动制药行业的DeNovoDesign80 2.3合成生物学与现代农业82 2.3.1AI4S在合成生物学中的应用实践82 I.AI4S与酶改造84 II.生物基化学品的生成84 III.生物燃料开发助力能源问题84 IV.AI4S与人造食品84 2.3.2AI4S在现代农业的应用86 I.科学育种86 II.化肥研发87 III.植保研究88 第三章:AIFORMATERIALSCIENCE原理与实践90 3.1材料研发的核心是建立准确的构效关系91 表4:材料研发领域的多尺度问题和AI4S示例93 AI4S实践(5):深势团队荣获领域最高荣誉“GordenBell Prize”;并不断突破极限,实现170亿原子的第一性建模,将分子动力学带入新时代94 AI4S实践(6):AI4S模型成功复现水、镓的相图,相关成果接连发表在领域顶刊《PRL》《PNAS》《NatureCommunications》等96 3.2金属材料中的AI4S应用98 3.2.1合金材料98 AI4S实践(7):AI4S将结构搜索能力提高10000倍,展示合金理性研发新范式100 3.2.2催化材料101 AI4S实践(8):《ACSNano》收录AI4S应用于电催化微观反应机理的研究102 3.3高分子材料的AI4S应用103 AI4S实践(9):聚合物结构和溶液中动态性能数据驱动粗粒度建模104 3.4陶瓷和无机材料的AI4S应用105 3.4.1陶瓷105 AI4S实践(10):航天科技团队使用AI4S定向设计高熵材料,助力高性能航材研发106 3.4.2水泥108 3.4.3纳米材料109 I.石墨烯109 II.碳纳米管110 III.碳炔110 3.4.4金属有机框架(MOF)111 3.5复合材料的AI4S应用112 AI4S实践(11):《NatureCommunications》收录Monash大学复合材料原位纳米析出机理研究113 3.6AI4S赋能材料研发的DeNovoDesign114 第四章:AIFORENERGYSCIENCE原理与实践115 4.1能源行业的现状和挑战116 4.2化石能源与AI4S117 I.AI4S+流体力学117 II.AI4S+燃烧反应过程119 III.AI4S+燃烧污染机理研究120 IV.AI4S+高能材料121 表5.燃烧中的科学问题与AI4S实践123 AI4S科研实践(12):《NatureCommunications》收录华东师范大学团队航空发动机燃烧机理研究 ..................................................................................................................................................................................125 4.3电池与AI4S126 4.3.1电池研发的特点:多场景,多尺度,多技术栈126 4.3.2电池研发的多尺度难题与AI4S范式128 表6:主要电池材料体系的理论优势、技术难点和AI4S的实践示例130 AI4S实践(13):AI4S助力宁德时代等团队研究下一代锂金属负极体系132 AI4S实践(14):AI4S模型实现硫系固态电解质组分搜索,展示高通量虚拟筛选可行性134 4.3.3”BeyondLithium”--AI4S赋能钠电池的基础理论建设135 AI4S实践(15):《EnergyEnviron. Sci》等期刊收录AI4S钠电池固态电解质研究,发现提高核心参数电导率的新理论思路136 4.4太阳能与AI4S137 4.5核能与AI4S140 AI4S实践(16):DeepMind对核聚变进行物理仿真并展示AI控制托克马克142 4.6氢能源与AI4S143 4.7热电技术与AI4S144 4.8储能技术与AI4S145 I.化学储能146 II.热储能146 第五章:AIFORELECTRONICENGINEERING&COMPUTERSCIENCE原理与实践148 5.1半导体材料与工艺149 表7:半导体设计与工艺中的AI4S151 5.1.1“MoreMoore”--AI4S为硅半导体先进制程开发提供新工具152 AI