您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[开放数据中心委员会]:数据中心暖通系统AI节能开放架构白皮书 - 发现报告

数据中心暖通系统AI节能开放架构白皮书

AI智能总结
查看更多
数据中心暖通系统AI节能开放架构白皮书

版权声明 ODCC(开放数据中心委员会)发布的各项成果,受《著作权法》保护,编制单位共同享有著作权。 转载、摘编或利用其它方式使用ODCC成果中的文字或者观点的,应注明来源:“开放数据中心委员会ODCC”。 对于未经著作权人书面同意而实施的剽窃、复制、修改、销售、改编、汇编和翻译出版等侵权行为,ODCC及有关单位将追究其法律责任,感谢各单位的配合与支持。 编写组 项目经理: 杨朴腾讯科技(深圳)有限公司 工作组长: 岳上腾讯科技(深圳)有限公司 贡献专家: 李鼎谦腾讯科技(深圳)有限公司粟海翰腾讯科技(深圳)有限公司吴越腾讯科技(深圳)有限公司王者腾讯科技(深圳)有限公司-犀牛鸟项目郑万富腾讯科技(深圳)有限公司-犀牛鸟项目吴偲腾讯科技(深圳)有限公司-犀牛鸟项目王振中国移动通信有限公司杨清中国移动通信有限公司朱青山中国移动通信有限公司员东照中国移动通信有限公司翟骏中国电信股份有限公司北京分公司龙丽萍中兴通讯股份有限公司段凯文中兴通讯股份有限公司刘明中兴通讯股份有限公司徐雷阿里云计算有限公司颜雨潇阿里云计算有限公司许可欣中国信息通信研究院刘大闯深圳市中电电力技术股份有限公司 前言 数据中心耗能已经占据全社会总用电量的3%左右,其中暖通系统最多可占据数据中心耗能的40%,实践证明AI节能可实现数据中心制冷效率的10%以上优化,AI节能作为PUE综合优化的重要组成部分,成为实现双碳目标和ESG能源可持续的关键技术手段。然而AI模型黑盒化和封闭数据源导致大量定制型项目,形成新的数据孤岛,缺乏统一节能效率评估和模型成熟度定义导致ROI和可靠性客观分析困难,阻碍了AI节能在数据中心行业的应用。 为推进AI节能在数据中心行业大规模推广覆盖,特编制数据中心暖通系统AI节能开放架构白皮书。通过开放语义数据集、开放仿真平台和智能调优策略增强AI节能模型的的可解释、可迁移和自学习能力;构建安全沙箱、数据治理和主动运维确保暖通调优系统可靠性;并统一节能效率评估和模型成熟度评估,提升数据中心业主和运营方采纳AI节能的信心并降低决策成本;开放建模方法和调优策略,提供数据中心行业暖通系统AI节能最佳实践。AI节能开放架构有助于加速AI调优的开发研究和部署应用,实现PUE综合优化和节能降本,在可靠运营的前提下实现能源的可持续发展,为双碳目标做出贡献。 本白皮书从暖通系统机理模型出发,定义AI节能总体开放架构包括八个核心模块,分别阐述开放语义数据集、白盒安全沙箱、开放仿真平台、数据治理规范、智能调优策略、节能效率评估、调优系统可靠性和模型成熟度等级。 本白皮书可作为数据中心业主、运营经理、暖通工程师、BA系统供应商、节能服务商、开发人员、高校研究和相关节能从业者的技术参考。 由于时间仓促,水平所限,错误和不足之处在所难免,欢迎各位读者批评指正。如有意见或建议请联系编写组。 目录 版权声明............................................................I编写组.............................................................II前言............................................................III 三、AI节能开放架构..............................................4 (一)制冷系统.................................................4(二)AI节能...................................................4(三)AIOps平台................................................5(四)开放架构.................................................6 (一)BRICK结构定义...........................................10(二)BRICK建模方法...........................................11(三)暖通设备模型............................................17(四)查询BRICK模型..........................................24(五)生成开源数据集..........................................28(六)种子数据集..............................................29 (一)仿真语言的选择..........................................38(二)Modelica仿真平台........................................39(三)冷源系统组件............................................40(四)仿真系统集成............................................55(五)冷源仿真系统............................................56 九、节能效率评估................................................97(一)能效定义................................................97(二)节能公式................................................97(三)计算方法................................................99十、调优系统可靠性.............................................102(一)潜在失效模式分析.......................................102(二)失效风险...............................................103(三)交付测试...............................................105(四)应急预案...............................................106(五)设备健康度.............................................106(六)动态可靠性.............................................108(七)主动运维服务...........................................109十一、模型成熟度等级..............................................110(一)成熟度评估维度.........................................111(二)成熟度等级定义.........................................111(三)可解释的AI策略........................................112 数据中心暖通系统AI节能开放架构白皮书 一、术语定义 二、项目背景 数据中心总能耗占据全社会总用电量的2%-3%,制冷系统能耗又占数据中心总能耗的25%-40%,AI节能技术逐步成熟并开始试点使用,平均能提升10%-15%制冷效率。AI节能作为PUE综合优化的重要组成部分,成为实现双碳目标和ESG能源可持续的关键技术手段之一。 然而,目前AI节能商业解决方案面临较大挑战,包括AI模型和控制逻辑黑盒化、封闭数据源和缺乏数据质量标准、定制型项目周期长、成本高并形成新的数据孤岛、缺乏节能效率和可靠性统一评价体系,闭源系统缺乏生态合作等。 数据中心暖通系统AI节能开放架构白皮书 为此定义数据中心AI节能开放架构,通过开放语义数据集、融合机理的AI调优架构、开放仿真平台和AI节能模型的成熟度等级定义,增强AI节能的开放性、透明性和可量化,实现可解释性的人工智能,并通过白盒安全沙箱、数据治理规范和调优系统可靠性,增强数据中心业主采纳智能化和精细化运营的信心,统一节能效率评估,推动AI节能在数据中心行业的规模化覆盖和提升能源效率,实现降本增效和能源可持续发展。 三、AI节能开放架构 (一)制冷系统 数据中心可简化定义为一台超级计算机,输入电力输出算力,并根据能量守恒定律将消耗的电力转换为热力,制冷系统通过冷源末端将热力从机房内部导出到冷源系统,并中和到周围空气。 制冷系统根据热交换方式可分为水冷系统、风冷系统和液冷系统,其中水冷系统由冷源系统和冷源末端组成:冷源系统组件主要包括冷却塔、冷却泵、冷机、冷冻泵和蓄冷罐,一般基于PLC(可编程逻辑控制器)或DDC(数字化直控系统)对泵、阀门和风机等基础设施进行PID控制,最终集成到BA(楼宇自动化)系统进行集中管理和调优。 (二)AI节能 BA系统控制基于暖通机理进行具体编程,通过实时监测所有设备状态,并基于配置和控制参数,根据规则和策略联动具体设备,通过闭环自控实现系统控制,核心是保障暖通系统的可靠运行,一般对控制参数都设定严格的约束,并确保系统留有足够安全裕量,系统运行模式相对比较固定。运维专家根据经验会在不同的季节或IT负荷有较大调整后做一些手动调优,但比较依赖于人工经验,耗费运维人力,且节能空间有待进一步挖潜。 AI节能是一种基于AI算法驱动的以制冷系统为主的调优方案,通常为避免系统复杂性和可靠性问题AI不直接控制或调节具体设备 参数,而是与BA系统对接,通过控制启停台数、运行频率和回水温度等系统参数,实现整体调优。AI通过大数据训练,学习到变量之间的潜在关联关系,并能在上百万个参数组合中寻找到最优或次优的策略。 相比BA系统自控或运营专家人工调优,AI具有适应性强、更快调优周期、关注全局优化和数据决策等优势,一般都能取得较好的调优效果。然而,AI节能面对的主要挑战在于AI算法的天然不可解释性、受数据质量影响大和缺乏行业标准,也就是AI算法的安全性和可靠性存疑,导致AI节能还停留在少量试点的阶段。 (三)AIOps平台 AIOps从DevOps思想发展而来,由AI驱动的智能化运营方法论,并受SRE影响关注系统整体可靠性,强调一站式平台、低码开发、自动化流程和安全性。 通过对多个AI节能项目和研发架构的最佳实践,建议一种基于AIOps的开放架构。AIOps设计包含四个基本原则: 产品思维:AI节能应遵循标准产品设计思维,关注设计和制定标准,可批量复制和覆盖到大规模数据中心机房。 平台思维:可视化开发平台,连接开发工程师、暖通专家和算法专家;低码开发平台,支持交付工程师实现对具体项目实例化配置;集中管理平台,支持运营专家随时查看服务状态、节能效果和应急操作。 安全思维:数据中心是保持IT关键业务连续性运营的数字底座,可靠性要求99.9999%。AI节能应遵循安全-覆盖-优化的设计策略,首先确保安全成为开放架构的一等公民,并兼容超大规模数据中心集群的异构暖通系统,最后面向整体调优和可持续升级。 开放思维:开放架构并不仅指开放的API,还包括组件化、白盒化、标准化和流程化,即平台由标准组件组成,组件本身是有明确接口和指标定义,多个组件供应商的组件只要符合性 能 和 安 全 需 求 即 可 替 换 使 用 , 而 且