数据中心暖通系统AI节能开放架构白皮书ODCC-2023-06002 1 [编号ODCC-2023-06002] 数据中心暖通系统AI节能开放架构白皮书 开放数据中心委员会2023-09发布 数据中心暖通系统AI节能开放架构白皮书ODCC-2023-06002 版权声明 ODCC(开放数据中心委员会)发布的各项成果,受《著作权法》保护,编制单位共同享有著作权。 转载、摘编或利用其它方式使用ODCC成果中的文字或者观点的,应注明来源:“开放数据中心委员会ODCC”。 对于未经著作权人书面同意而实施的剽窃、复制、修改、销售、改编、汇编和翻译出版等侵权行为,ODCC及有关单位将追究其法律责任,感谢各单位的配合与支持。 I 数据中心暖通系统AI节能开放架构白皮书ODCC-2023-06002 编写组 项目经理: 杨朴腾讯科技(深圳)有限公司工作组长: 岳上腾讯科技(深圳)有限公司 贡献专家: 李鼎谦腾讯科技(深圳)有限公司粟海翰腾讯科技(深圳)有限公司吴越腾讯科技(深圳)有限公司 王者腾讯科技(深圳)有限公司-犀牛鸟项目郑万富腾讯科技(深圳)有限公司-犀牛鸟项目吴偲腾讯科技(深圳)有限公司-犀牛鸟项目王振中国移动通信有限公司 杨清中国移动通信有限公司朱青山中国移动通信有限公司员东照中国移动通信有限公司 翟骏中国电信股份有限公司北京分公司龙丽萍中兴通讯股份有限公司 段凯文中兴通讯股份有限公司刘明中兴通讯股份有限公司 徐雷阿里云计算有限公司颜雨潇阿里云计算有限公司许可欣中国信息通信研究院 刘大闯深圳市中电电力技术股份有限公司 II 数据中心暖通系统AI节能开放架构白皮书ODCC-2023-06002 前言 数据中心耗能已经占据全社会总用电量的3%左右,其中暖通系统最多可占据数据中心耗能的40%,实践证明AI节能可实现数据中心制冷效率的10%以上优化,AI节能作为PUE综合优化的重要组成部分,成为实现双碳目标和ESG能源可持续的关键技术手段。然而AI模型黑盒化和封闭数据源导致大量定制型项目,形成新的数据孤岛,缺乏统一节能效率评估和模型成熟度定义导致ROI和可靠性客观分析困难,阻碍了AI节能在数据中心行业的应用。 为推进AI节能在数据中心行业大规模推广覆盖,特编制数据中心暖通系统AI节能开放架构白皮书。通过开放语义数据集、开放仿真平台和智能调优策略增强AI节能模型的的可解释、可迁移和自学习能力;构建安全沙箱、数据治理和主动运维确保暖通调优系统可靠性;并统一节能效率评估和模型成熟度评估,提升数据中心业主和运营方采纳AI节能的信心并降低决策成本;开放建模方法和调优策略,提供数据中心行业暖通系统AI节能最佳实践。AI节能开放架构有助于加速AI调优的开发研究和部署应用,实现PUE综合优化和节能降本,在可靠运营的前提下实现能源的可持续发展,为双碳目标做出贡献。 本白皮书从暖通系统机理模型出发,定义AI节能总体开放架构包括八个核心模块,分别阐述开放语义数据集、白盒安全沙箱、开放仿真平台、数据治理规范、智能调优策略、节能效率评估、调优系统可靠性和模型成熟度等级。 III 数据中心暖通系统AI节能开放架构白皮书ODCC-2023-06002 本白皮书可作为数据中心业主、运营经理、暖通工程师、BA系统供应商、节能服务商、开发人员、高校研究和相关节能从业者的技术参考。 由于时间仓促,水平所限,错误和不足之处在所难免,欢迎各位读者批评指正。如有意见或建议请联系编写组。 IV 数据中心暖通系统AI节能开放架构白皮书ODCC-2023-06002 目录 版权声明I 编写组II 前言III 一、术语定义1 二、项目背景2 三、AI节能开放架构4 (一)制冷系统4 (二)AI节能4 (三)AIOps平台5 (四)开放架构6 四、开放语义数据集10 (一)BRICK结构定义10 (二)BRICK建模方法11 (三)暖通设备模型17 (四)查询BRICK模型24 (五)生成开源数据集28 (六)种子数据集29 五、白盒安全沙箱30 (一)安全沙箱原理31 (二)数据健康度约束32 (三)策略寻优过程约束33 (四)策略寻优结果约束35 V 数据中心暖通系统AI节能开放架构白皮书ODCC-2023-06002 (五)实时控制硬逻辑35 六、开放仿真平台38 (一)仿真语言的选择38 (二)Modelica仿真平台39 (三)冷源系统组件40 (四)仿真系统集成55 (五)冷源仿真系统56 七、数据治理规范67 (一)标准测点表67 (二)采集协议69 (三)控制协议70 (四)数据处理70 (五)数据质量72 (六)数据治理73 (七)数据校准75 (八)寻优变更76 (九)数据训练78 八、智能调优策略79 (一)“数据+机理”双驱动模型80 (二)数字孪生预测模型81 (三)AI节能算法81 (四)BA水冷自控系统AI控制82 (五)群控系统优化策略91 (六)精密空调AI控制策略93 VI 数据中心暖通系统AI节能开放架构白皮书ODCC-2023-06002 九、节能效率评估97 (一)能效定义97 (二)节能公式97 (三)计算方法99 十、调优系统可靠性102 (一)潜在失效模式分析102 (二)失效风险103 (三)交付测试105 (四)应急预案106 (五)设备健康度106 (六)动态可靠性108 (七)主动运维服务109 十一、模型成熟度等级110 (一)成熟度评估维度111 (二)成熟度等级定义111 (三)可解释的AI策略112 VII 数据中心暖通系统AI节能开放架构白皮书ODCC-2023-06002 数据中心暖通系统AI节能开放架构白皮书 一、术语定义 表1 术语 定义 数据中心 DataCenter,特指集中承载企业IT信息服务或云计算的物理空间,通常由房间、楼宇和园区组成,通过机架安置服务器、网络和存储等IT设备,并提供必要的电力、制冷、动环、能源、安防和消防子系统支撑。 ODCC 开放数据中心委员会(OpenDataCenterCommittee) PUE PowerUsageEffectiveness,评价数据中心能源效率的指标;PUE=数据中心总能耗/IT设备能耗。 DevOps 一种融合软件开发和IT运维的研效协同和最佳实践,通过自动化流程、持续集成和持续发布(CI/CD),提高软件交付效率、持续改进质量和降低成本。 SRE 站点可靠性工程(SiteReliabilityEngineering),针对大规模分布式系统运维的最佳实践,将软件工程和运维思维结合起来,通过自动化手段实现站点整体的可靠性。 AIOps 从DevOps思想发展而来,由AI驱动的智能化运营方法论,并受SRE影响关注系统整体可靠性,强调一站式平台、低码开发、自动化流程和安全性。 BA 指楼宇自动化(BuildingAutomation),实现园区基础设施系统集成,通过传感器、执行器和控制算法提高楼宇运营效率、减少能耗和保障系统可靠性。 可信数据 特指具备语义描述和质量定义的监控数据和运营数据,从采集、传输、存储、显示和访问的全过程都确保准确性、全面性、及时性、一致性和安全性。 可解释的人工智能 特指针对数据中心智能运营出于对系统可靠性的考虑,要求AI需要深度融合专业知识、热学机理和运营经验,具备可解释性,可以通过暖通专家、运营专家和监控专家的联合评审。 开放数据语义 在可信数据集的基础上延展出来的开源数据集,通过对商业数据的脱敏和子集处理,本项目特指基于BRICK标准构建的暖通系统开放数据语义。 开放仿真平台 指融合机理模型和数据驱动的仿真平台,作为BA系统、冷源末端、乃至IT设备的数字孪生,可响应调优控制策略模拟系统变化,其中设备模型基于Modelica(优选)、MATLAB等开放建模语言定义,并开放仿真测试接口。 模型成熟度 通过节能性、合理性、安全性、平衡性和计算性的维度评价AI节能模型的综合能力,按成熟度定义等级评估模型是否可以达到辅助决策或自动决策的标准。 BRICK BRICK是一个开源的数据模型和标记语言,旨在帮助建筑和智能建筑领域的数据交换和集成。BRICK数据集的结构定义由一组OWL本体文件和RDF数据文件组成,用于定义建筑系统中的实体、属性和关系。 RDF 指资源描述框架(ResourceDescriptionFramework,RDF),是一个使用XML语法来表示的资料模型(DataModel),用来描述Web资源的特性及资源之间的关系。 1 数据中心暖通系统AI节能开放架构白皮书ODCC-2023-06002 Modelica Modelica是一种面向对象、基于方程的声明式编程语言(declarativelanguage)。它可支持热、电、磁、力跨学科模拟(multi-domainmodeling),作为多学科统一建模仿真的国际标准,被仿真界广泛采用。因为可输出梯度信息,它求解速度快,同时有一个活跃的开发者社区。 MATLAB Matlab是一种通用的数值计算和科学编程语言,用于数学计算、数据处理和算法开发。它使用基于脚本的编程方法,适合广泛的科学和工程应用,更具灵活性。此外,Matlab具有强大、成熟的生态系统,可与海量软件实现交互,如监控系统设计软件Labview,直接支持Matlab软件程序的部署。 二、项目背景 数据中心总能耗占据全社会总用电量的2%-3%,制冷系统能耗又占数据中心总能耗的25%-40%,AI节能技术逐步成熟并开始试点使用,平均能提升10%-15%制冷效率。AI节能作为PUE综合优化的重要组成部分,成为实现双碳目标和ESG能源可持续的关键技术手段之一。 图1AI节能优化数据中心PUE 然而,目前AI节能商业解决方案面临较大挑战,包括AI模型和控制逻辑黑盒化、封闭数据源和缺乏数据质量标准、定制型项目周期长、成本高并形成新的数据孤岛、缺乏节能效率和可靠性统一评价体系,闭源系统缺乏生态合作等。 2 数据中心暖通系统AI节能开放架构白皮书ODCC-2023-06002 图2AI模型黑盒化面临挑战 为此定义数据中心AI节能开放架构,通过开放语义数据集、融合机理的AI调优架构、开放仿真平台和AI节能模型的成熟度等级定义,增强AI节能的开放性、透明性和可量化,实现可解释性的人工智能,并通过白盒安全沙箱、数据治理规范和调优系统可靠性,增强数据中心业主采纳智能化和精细化运营的信心,统一节能效率评估,推动AI节能在数据中心行业的规模化覆盖和提升能源效率,实现降本增效和能源可持续发展。 3 数据中心暖通系统AI节能开放架构白皮书ODCC-2023-06002 三、AI节能开放架构(一)制冷系统 数据中心可简化定义为一台超级计算机,输入电力输出算力,并根据能量守恒定律将消耗的电力转换为热力,制冷系统通过冷源末端将热力从机房内部导出到冷源系统,并中和到周围空气。 制冷系统根据热交换方式可分为水冷系统、风冷系统和液冷系统,其中水冷系统由冷源系统和冷源末端组成:冷源系统组件主要包括冷却塔、冷却泵、冷机、冷冻泵和蓄冷罐,一般基于PLC(可编程逻辑控制器)或DDC(数字化直控系统)对泵、阀门和风机等基础设施进行PID控制,最终集成到BA(楼宇自动化)系统进行集中管理和调优。 (二)AI节能 BA系统控制基于暖通机理进行具体编程,通过实时监测所有设备状态,并基于配置和控制参数,根据规则和策略联动具体设备,通过闭环自控实现系统控制,核心是保障暖通系统的可靠运行,一般对控制参数都设定严格的约束,并确保系统留有足够安全裕量,系统运行模式相对比较固定。运维专家根据经验会在不同的季节或IT负荷有较大调整后做一些手动调优,但比较依赖于人工经验,耗费运维人力,且节能空间有待进一步挖潜。 AI节能是一种基于AI算法驱动的以制冷系统为主的调优方案,通常为避免系统复杂性和可靠性问题AI不直接控制或调节具体设备 4 数据中心暖通系统AI节能开放架构白皮书ODCC-2023-0600