汽车制造行业的数字化转型算力应用案例 先进计算产业发展联盟 2023年12月 版权声明 本研究报告版权属于先进计算产业发展联盟,并受法律保护。转载、摘编或利用其它方式使用本研究报告文字或者观点的,应注明“来源:先进计算产业发展联盟”。违反上述声明者,将追究其相关法律责任。 前言 汽车开发是一项复杂的系统工程,涉及众多的零部件开发和多学科方面的研究。传统的开发方式不能满足企业对汽车开发周期更高要求,而CAD/CAE技术应用到汽车开发中,可大幅度提升汽车开发设计的能力,指导新产品开发设计,优化产品结构与性能,降低设计和制造成本增加效益,从而提升汽车生产企业的市场竞争力。随着仿真模型越来越复杂,仿真精度提高,计算划分的网格数量越来越多,对仿真计算的设备要求也越来越高,采用高性能计算提供的算力才能支撑庞大的计算。汽车行业在从传统制造向智能制造转型,汽车行业研发也在向智能化转型,借助于科学计算手段使用CAD/CAE工具加速研发过程。 联想采用先进的技术和软硬件产品,构建高可用性、高稳定性、高安全性、高可靠性、高兼容性和高扩展性的新一代高性能计算中心,应用高性能计算帮助中国汽车头部制造企业,建设大型数据算力平台,支持整车仿真业务,赋能项目快速开发,提升企业竞争力。 建设的吉利星睿智算中心·智能仿真平台算力位居中国榜上制造业第一,使中国车企首次登上全球算力500强榜单。智能数据平台与智能仿真平台两大算力底座共同赋能,将进一步加速吉利汽车集团智能新能源转型,实现吉利在智算领域领先行业2-3年的代际优势,真正迎来属于吉利的“智算时代”。 编制单位:先进计算产业发展联盟 参编单位:联想(北京)信息技术有限公司参编人员:郝常杰、崔吉顺、陈齐旺、田亚宇 目录 一、汽车制造行业的研发仿真1 (一)前处理2 (二)模拟(求解/计算)3 (三)后期处理5 二、算力在汽车制造行业的数字化转型应用案例6 (一)联想XCLOUD算力平台架构6 1、平台整体功能架构6 2、多租户管理与运营关键功能7 3、算力资源管理9 4、集群运维管理关键功能13 5、资源运维和监控15 6、新一代温水水冷基础架构19 (二)应用案例效果22 1、吉利智能仿真平台居中国上榜制造业第一22 2、吉利星睿智算中心智能仿真平台22 3、仿真平台构建智能研发新生态23 4、智能仿真平台进入全球算力500强25 图目录 图1典型CFD/显式FEA和隐式FEA模拟的文件I/O速率5 图2算力平台整体功能架构图7 图3关键功能示意截图8 图4统一运维入口8 图5多租户管理9 图6资源数量查看10 图7算力资源申请10 图8计量计费功能11 图9消费概览11 图10业务运行状态大屏12 图11自定义大屏13 图12集群资源管理13 图13裸金属资源管控14 图14服务器管理15 图15集群资源自动化运维16 图16自动化运维模块17 图17统一告警能力18 图18算力平台资源监控19 图19计算集群20 图20吉利星睿智算中心23 图21汽车设计仿真24 图22吉利智能仿真平台入全球算力500强榜单26 一、汽车制造行业的研发仿真 汽车开发是一项复杂的系统工程,不仅零件众多而且结构复杂,在整车开发过程中,涉及到流体、结构、温度、电磁、噪音、振动、平稳及车辆动力学等多方面的研究。 随着工业技术的迅速发展和消费质量的提高,人们对车辆要求也越来越高,企业对汽车开发周期有了更高的要求。传统的开发方式已经不能满足要求,而CAD/CAE技术应用到汽车开发中,可大幅度提升汽车开发设计的能力,指导新产品开发设计,优化产品结构与性能,降低设计和制造成本增加效益,从而提升汽车生产企业的市场竞争力。 CAE技术在汽车设计中主要应用于结构强度分析、NVH(噪音、振动、平稳)分析、疲劳耐久分析、碰撞安全分析、空气动力学分析等方面。汽车结构强度分析是保证汽车安全性、可靠性的重要指标,是CAE技术在汽车工程中应用最广泛的方面。汽车结构强度分析一般都是应用有限元法对汽车的结构进行数值计算。NVH(噪音、振动、平稳)分析涉及车汽车产品的舒适性,直接关系到消费者的体验。疲劳耐久性能分析是评价汽车各主要结构部件在功能失效前所经历的时间。采用CAE方法是利用仿真的方式,采用道路试验载荷,计算车身及关键部件连接处载荷与疲劳寿命,减少道路模拟试验,缩短成本和时间。碰撞安全分析中,使用CAE技术对汽车碰撞过程进行仿真模拟,解决碰撞大变形的非线性问题,减少实车模拟碰撞高试验成本。汽车空气动力学主要是研究汽车行驶时,即与空气产生相对运动 1 时,汽车周围的空气流动情况和空气对汽车的作用力(称为空气动力),以及汽车的各种外部形状对空气流动和空气动力的影响。 随着CAE仿真的模型越来越复杂,仿真精度提高,计算划分的网格数量越来越多,对仿真计算的设备要求也越来越高,采用高性能计算提供的算力才能支撑庞大的计算。汽车行业在从传统制造向智能制造转型,汽车行业研发也在向智能化转型,借助于科学计算手段使用CAD/CAE工具加速研发过程。在新车型的研发阶段,要用多种CAD/CAE工具软件,典型的CAD/CAE工作流程有三个阶段:前处理、模拟(求解/计算)、后处理。 (一)前处理 在前处理(预处理)阶段,对设计模型定义/设计几何结构或工艺,通过计算机辅助设计CAD软件通常用于对底层几何结构或过程进行建模,将设计的物理属性以及环境和物理约束和载荷应用于计算模型。在CFD和FEA分析的情况下,必须使用网格将基本几何结构划分为较小的离散域(单元);通常称为网格生成或网格化。 笔记本电脑、工作站和远程可视化服务器通常用于大多数预处理CAD/CAE工作和网格生成。这些解决方案通常具有更高端的图形卡以加速可视化,并且可能需要大量的内存,具体取决于计算模型的大小。更大的CFD和FEA网格生成可以“卸载”到具有更多计算或内存资源的服务器上。在一些应用中,网格生成可以使用到并行处理技术。 (二)模拟(求解/计算) 在模拟阶段,使用基础物理的适当数学公式来模拟(求解/计算)模型或过程。此阶段通常有大量的计算工作负载,需要完整的高性能解决方案来运行大多数情况下也是非常必要的。计算工作量取决于计算模型的大小,小型计算模型可以在工作站和笔记本电脑上运行,而大型计算模型通常在高性能计算解决方案上运行,以利用多个服务器、GPU加速、高速互连网络和并行存储系统等来加速求解/计算过程,提高生产效率。 在模拟阶段,通常使用显式和隐式两种数值方法来求解基本数学方程: 显式法 在显式方法中,当前物理值仅取决于先前的时间步长/迭代数据,因此可以通过计算表达式在网格中的任何位置求解方程。这需要更多的计算,但占用的内存相对较少。 隐式法 在隐式方法中,物理值不依赖于先前的时间步长/迭代;必须对网格中的所有单元同时求解方程。此方法更占用内存,因为所有需要计算的内容都必须提交到内存中,因此需要占用更多的内存,同时也需要适量的计算。 不同的方法具有不同的计算特点和性能要求,通常CFD和显式 FEA模拟具有相同的计算和存储特性,比如可以很好地扩展到多个核心和服务器(支持MPI跨节点并行);计算对内存和计算敏感(需要 更多的内存和CPU核心);计算期间的小量的文件输入/输出(I/O)操作;模拟开始时的大量文件I/O操作,以便将网格从存储系统读入内存(存储系统的单流的能力)。模拟结束时的大量文件I/O操作,以便写入存储系统。这些文件通常是由网格和相关物理值组成的最终输出文件(存储系统的单流的能力)。用户可以指定在模拟过程中以不同的时间间隔写入检查点(checkpoint)输出文件,这可能会导致短暂的重要文件I/O操作(配合作业调度系统支持checkpoint)。计算所需要的内存的数量取决于计算模型的大小,ANSYSFluent和Mechanical、DassaultSystèmesABAQUS/Explicit、LSTCLSDYNA、OpenFOAM和SiemensSTAR-CCM+等应用程序都属于上述类别。 而通常隐式FEA模拟具有以下计算和存储特性:不能很好地扩展到多个核心和服务器(在SMP上的性能更突出);计算对比内存来讲,内存比计算更敏感(同时兼具计算敏感和内存敏感);计算时进行大量的文件I/O操作;通常需要大量的内存;数据在内存中计算可用于减少文件I/O操作的数量;可以从GPU加速中获益(部分应用)。ANSYSMechanical、DassaultSystèmesABAQUS/Standard和MSCNastran等应用程序都属于上述类别。 下图描述了典型CFD/显式FEA模拟与典型隐式FEA模拟的文件 I/O速率。 图1典型CFD/显式FEA和隐式FEA模拟的文件I/O速率 在CFD/ExplicitFEA模拟的开始和结束时,有大量频繁的文件I/O操作,但这些事件是简短的。在计算期间,存在最小的文件I/O操作。然而,对于隐式FEA模拟,在整个模拟过程中存在大量的文件I/O操作。 (三)后处理 在后期处理阶段,将模拟的结果呈现并显示给用户。结果可以是输出,如表格、绘图、数据文件和动画,也可以在软件中以3D表示形式查看。 计算机、工作站和远程可视化服务器通常用于大多数后处理工作。这些解决方案通常具有更高端的图形卡以加速可视化,并且可能需要大量的内存,具体取决于计算模型的大小。如果使用自动化脚本来生成输出,则可以将一些后处理工作“卸载”到服务器。大多数函数都是单线程进程。 在汽车研发CAD/CAE使用过程中,为提高效率,大多采用多团队 协同的方式,单台的笔记本、工作站或服务器已经不能满足这样的要 求,将前处理、模拟和后处理在算力平台上运行,能够更快的解决设计中的问题。 二、算力在汽车制造行业的数字化转型应用案例 (一)联想xCloud算力平台架构 顶层设计基于客户应用场景需求构建“高性能计算+私有云”的融合型平台模式。基于这样的顶层设计,方案提供了一种快捷、弹性、安全、物理隔离并可实现资源灵活调用的基于联想xCloud私有云平台的云化高性能计算系统。它能提供CPU和GPU的混合硬件算力服务,主要应用于汽车行业CAE场景相关的高性能计算、深度学习的相关业务需求,完成了高性能计算和私有云的良好结合,实现了高性能计算即服务的转化。并以此实现了平台运营所需的租户隔离环境以及高性能计算计算资源的弹性定制,敏捷部署,降低成本,提高资源利用率,具有更大的灵活性。 1、平台整体功能架构 联想高性能计算运维管理平台是联想xCloud混合云管理解决方案中针对算力平台环境,以高性能计算典型的裸金属计算节点为主要管理资源对象,综合多租户运营管理,集群资源管理,全栈监控,自动化运维,智慧大屏等关键能力的一体化算力运维管理平台。该平台基于同一个工作台,同时提供面向高性能计算资源租户和高性能计算 平台管理员不同角色的资源申请,资源使用,资源维护等场景的日常运维工作。 联想算力运维管理平台提供标准的RestfulAPI接口,支持和吉利集团现有的其他运维系统进行数集成,包括CMDB,BPM等系统。 平台整体功能架构图如下所示: 图2算力平台整体功能架构图 2、多租户管理与运营关键功能 (1)统一访问功能控制 该平台的公共服务组件为管理中心模块,包括组织管理,认证方式管理,邮件服务,用户及权限管理,审计日志,用户个人信息管理,通知服务等。用户使用邮箱登录系统,系统支持本地登录,LDAP登录,SAML登录等方式,支持双因子、验证码等增强校验。关键功能示意截图如下: 图3关键功能示意截图 (2)统一运维入口 平台支持一个管理页面入口进行全产品的资源管理。不同用户登录界面的可见功能模块,可见的数据类型组件,可见数据范围,基于包括公共服务模块中的用户权限管理和功能实现模块的权限在内的双层管控机制进行控制。 图4统一运维入口 (3)多租户管理 平台支持高性能计算管理员为各个子公司创建不同的租户,配置不同租户的用户、组织、角色和租户