踏雪觅径: 探索材料软件的自主可控之路 计算机 评级:中性 日期:2024.07.18 证券研究报告|行业专题 报告要点 材料软件分为材料发现软件和材料计算软件,前者对应“预测”,后者对应“仿真”。材料研发流程是“预测-验证”。在预测阶段,材料发现软件通 过大数据和机器学习,找到材料成分、结构和性能参数之间关系的规律,由期望的性能参数,得到材料的预测列表。在验证阶段,材料计算软件通过初始材料和环境的数据计算出最终的性能参数,实现“模拟实验”。 材料软件能降本增效。传统的材料研发是“试错法”,费时费力,新材料从研发到产业化应用大约需要10-20年。根据美国材料基因组计划的报告,若应用先进的ICME研发模式和材料软件,能节省一半传统研发时间。 材料软件开发难度大。材料发现软件的核心是大数据和机器学习技术,有限的数据、昂贵的算力和算法的局限性是其发展的限制。材料计算软件发展较 为成熟,核心是将不同场景的计算方法转化为代码,形成不同计算模块,发展的难点在于多尺度计算的融合。 全球:材料软件发展成熟,市场天花板不高。材料发现软件多创新企业, Citrine是领先者;材料计算软件市场基本被传统工业软件巨头公司垄断,如达索的MaterialStudio、新思的QuantumATK,“小而美”的公司在细分领域有一定地位。同时,国外材料软件的商业价值不高:MaterialStudio的母公司Accelry,2014年被达索收购的金额约为7.5亿美元,商誉为4.5亿美元;2023年材料发现软件公司CitrineInformatics估值约仅不到1亿美元。 国内材料软件公司与国际存在差距。我国企业材料研发数字化程度低,尚未开始使用材料发现软件,材料计算软件渗透率低,市占率最高的是Material Studio。国内产品在计算场景、计算方法和数据库的丰富程度上和国外仍有差距。目前MaterialStudio对我国军方禁用,对我国新材料产业的自主可控产生了不利影响。 材料软件作为新材料产业必不可少的效率工具,如何实现自主可控?材料软件的开发难度大,材料软件的商业价值不高,很难完全依靠市场化的方式实现材料软件的自主可控,可能需要非市场化的方式推动国产材料软件的发展。 风险提示:1、材料计算、AI、算力等行业发展不及预期;2、国产化进程不及预期; 3、第三方数据有失真实性。 分析师孙亮 登记编码:S0950524040001:15021163017 :sunl8@wkzq.com.cn 联系人王何梦雅:13367000172 :wanghemengya@wkzq.com.cn 行业表现2024/7/17 4% -4% -13% -22% -31% -40% 2023/72023/102024/12024/4 计算机沪深300 资料来源:Wind,聚源相关研究 内容目录 一、什么是材料软件?4 (一)传统研发方式依赖人来试错,数字化研发方式极大提高了效率4 (二)发现阶段:AI+材料大大提高效率,但目前局限明显5 1、大数据和机器学习是材料发现软件的核心5 2、有限的数据、昂贵的算力和算法的局限性,是材料发现阶段的限制6 (三)验证阶段:材料计算软件可以计算多尺度问题,难点在于融合7 1、材料计算软件偏向微观和介观尺度的仿真7 2、多尺度计算平台是大势所趋,但进展有限8 3、材料计算软件产品成熟,将不同场景的计算模块化是核心9 二、全球材料软件发展成熟,市场天花板不高11 (一)材料发现软件多创新企业,材料计算软件多使用国外工业软件巨头的产品11 (二)国外材料软件市场价值低,难以通过自身形成极具商业利润的公司12 三、国内材料软件公司与国际存在差距12 四、国内材料软件公司的发展需要用非市场化手段解决13 附录1、材料软件和传统工业软件的区别14 附录2、学术类材料软件多“小而美”15 附录3、研发方式:从MGI到ICME,“数据驱动”是基础,“全生命周期”“集成”是进步15 附录4、以史鉴今:“人”“数据”“工具”的互联互通是材料研发数字化进程中的关键17 (1)ICME:概念的发展推动研发范式的转变17 (2)材料基因组计划:建设材料研发的基础设施18 风险提示20 图表目录 图表1:数字化研发方式能降本增效5 图表2:材料发现软件Citrine工作原理5 图表3:材料发现软件Matminer工作原理5 图表4:高通量计算的典型案例16 图表5:高通量计算的典型案例26 图表6:QuantumATK晶界建模示例7 图表7:MaterialStuidio原子建模7 图表8:微观、介观、宏观尺度刻画的时间与长度8 图表9:微观、介观、宏观尺度研究对象8 图表10:什么是多尺度?——以编织为例9 图表11:复合材料软件Digmat中编织模块Fiberism的示例9 图表12:QuantumATK的使用场景9 图表13:MaterialStudio不断更新,2008年加入介观计算模块Mesocite9 图表14:使用LAMMPS进行建模计算10 图表15:使用可视化软件ovito对lammps的结果进行可视化10 图表16:Visualizer模块(MaterialStudio)微观层次建模过程10 图表17:使用QuantumATK进行晶界建模10 图表18:AbsorptionLocator模块(MaterialStudio)吸附能计算结果11 图表19:AbsorptionLocator模块(MaterialStudio)吸附能可视化结果11 图表20:MPDS使用界面11 图表21:Citrine使用界面11 图表22:国外主流材料软件和国内情况对比表12 图表23:使用概念习惯上,狭义材料计算软件和CAD、CAE的联系和区别15 图表24:材料基因组-计算材料设计-ICME的概念解释16 图表25:材料基因组-计算材料设计-ICME发展时间轴17 图表26:一种对于多组元材料建模、模拟和设计的4阶段集成化多尺度方法18 图表27:MGI(2011&2014&2021)的基础设施框架20 图表28:MGI(2014)指出的四大挑战20 一、什么是材料软件? 材料软件是能帮助材料研发的软件,分为在预测环节起作用的材料发现软件,和在验证环节起作用的材料计算软件。 (一)传统研发方式依赖人来试错,数字化研发方式极大提高了效率 材料研发流程是“预测-验证”的过程。首先构建材料结构的预测池,然后通过实验或者计算机模拟的验证对应的性能,进而筛选、修改最初的预测。 材料传统的研发方式是“试错法”,费时费力。传统研发方式在预测环节中依赖总结文献、专家经验,用类似“炼金术”的方式,列出多种材料组合,在验证环节制造出样本,进行人工实验验证,再根据结果修改预测池或者重新设计材料结构,循环往复,如“大海捞针”,消耗 时间巨大,并且有些实验条件苛刻,难以实施。比如为了满足高强度、耐高温等特性,需要找到A金属在B基金属中最佳比例(0-10%),那么需要以0.5%为间隔,烧制0-10%含量的20个样品,进行测试对比,缩小比例范围,细化间隔,如以0.1%为间隔制作5%-7%的20个样本,再进行测试对比。如果是多元合金的制造,那么时间和成本将会成倍增加,十分费时费力费钱。 利用数字化的研发方式,可以降本增效。进入数字化时代后,模拟阶段的材料计算软件逐渐得到普及,随着大数据和机器学习的发展,材料发现软件涌现。根据美国材料基因组计划(MGI) 报告,按照传统的研发方式,新材料从发现到工业化应用大约需要10-20年的时间,而先进材料则需要20年甚至更长的时间,结合先进的集成材料计算工程(ICME)的研发方法,可以节省约一半的时间。比如在上一段的例子中,可以通过材料计算软件模拟得出A金属不同比例下、B基金属的性质,接着只需要在最佳范围5%-7%内进行验证,省去了一半的时间和成本。 在预测阶段,利用材料发现软件辅助总结经验。在构建预测池的过程中,材料发现软件通过 AI总结出材料结构和性能参数之间的关系,由期望的性能参数得出可能的结构列表。根据材料发现公司Citirine官网,材料公司HRL使用Citrine软件平台将开发时间从数年缩短到数天。在满足某个热性能的化合物发现案例中,在5个月的时间完成了超过了2500种新型聚合物的热性能预测,并且筛选出最可能的10种,省去了制造其余2490种聚合物的制造和验证环节。 在验证环节,利用材料计算软件“模拟实验”。在验证环节中,材料计算软件对初始条件进行建模(设置环境和材料结果的参数),通过计算机程序求解一系列物理方程或本构模型,进 而得到预测的性能参数。材料计算软件能通过“虚拟筛选”,最大限度地减少物理实验的数量。比如在设计某种高强度汽车外壳的时候,如果完全依赖于传统的实验方法,需要将每个预测的材料都制造出样本再进行碰撞实验,如果能用材料计算软件筛选出最理性的列表,减少“实际制造样品-实验”的流程,就能大大降低成本和时间。 图表1:数字化研发方式能降本增效 资料来源:机器学习在材料服役性能预测中的应用,五矿证券研究所 (二)发现阶段:AI+材料大大提高效率,但目前局限明显 在材料发现阶段,材料发现软件利用大数据和机器学习找到材料微观成分、结构和宏观性能之间的关系,进而构建预测池,可以提高人工构建预测池效率,降低成本。材料发现软件的难点在于有限的数据、高昂的算力和算法的局限性。 1、大数据和机器学习是材料发现软件的核心 材料发现软件的基础是大数据和机器学习。材料发现软件的原理是:通过大数据和机器学习技术,分析材料微观结构和宏观性能之间的关系,找到规律,来预测最符合目标要求的材料。 图表2:材料发现软件Citrine工作原理图表3:材料发现软件Matminer工作原理 资料来源:CitrineInformatics,五矿证券研究所资料来源:Matminer,五矿证券研究所 AI+材料可助力材料发现。如:美国加州大学圣地亚哥分校工程学院的纳米工程师开发的AI 算法M3GNet,可几乎即时地预测任何材料(无论是现有材料还是新材料)的结构和动态特性。GoogleDeepMind推出的材料发现工具GNoME将材料发现的效率提升了一个数量级,其材料团队发现了220万颗新晶体,相当于近800年的知识。 配方型材料发现有望先行一步。设计材料,最基本的是设计成分和结构。成分数量和最佳比例可以用“遍历罗列”的形式来找到,计算机更能胜任这种重复性的试验工作。结构千变万 化,一个分子中两个原子的相对位置、结合方式,一个分子团中分子的数量、构成方式等等众多三维要素都能够改变材料的性质,因此相对结构设计来说,成分设计更加机械。配方型材料在海外很成熟,在中国也是一个很重要的方向,很多化工材料是标准的复合材料过程, 对配方的依赖性非常强。如果有效的去对单一公司的配方数据、反应流程、性质等进行收集,并在这个基础上不停的进行预测和优化,对企业研发大量的新配方会起到非常重要的作用。比如巴斯夫、陶氏化学等公司早已有之。 2、有限的数据、昂贵的算力和算法的局限性,是材料发现阶段的限制 数据是材料发现软件发展中最大的掣肘,算力、算法也限制了性能推导结构的过程。 ①数据库:数据的可获得性,真实性以及精准性问题制约材料数据库发展 机器学习首先依赖的是海量、真实、精准的数据。材料发现软件本质是利用机器学习,找到数据库中材料结构和性能数据之间对应的关系,由想要的“性能”,构建“预测池”,因此数 据的质量和数量是关键。 打破企业间数据隔阂,建立大容量数据库较为困难。出于商业的考虑,新材料公司数据的保密性都是极高级别的,尽管能通过政策驱动、商业合作、购买等方式缓解数据鸿沟的问题, 但难以完全消除不同企业间数据的隔阂。 真实数据的问题:公开数据的真实性有待考究。有些学术论文中的数据并不真实可靠,学术论文是公开数据的重要组成部分,但学术论文的数据中,部分偏差较大,因此很多情况下企业对此类数据并不信任,而