金融数据中心 人工智能算力建设指引 北京金融科技产业联盟 2023年8月 版权声明 本白皮书版权属于北京金融科技产业联盟,并受法律保护。转载、编摘或利用其他方式使用本白皮书文字或观点的,应注明来源。违反上述声明者,将被追究相关法律责任。 编制委员会 编委会成员: 王长江聂丽琴张海燕 编写组成员: 赵春华 王妍娟 葛金磊 张浩然 吴仲阳 宋虎 余学山 白阳 符海芳 李书建 黄志鹏 徐旭 陆碧波 薛亮 谭翔 马庆杰 李洁 郭亮 王月 吴刚 郭江波 吴战立 雷昭燕 袁智 王伟锋 李培 彭晋 李俊奎 杨海悌 俞颖熙 程归鹏 张贯忠 李鸿鹏 宋 飞 玄凌博 郑鹏飞 黎世勇 王云凤 编审:黄本涛 周豫齐 王妍娟 张浩然 参编单位: 北京金融科技产业联盟秘书处 北京国家金融科技认证中心有限公司中国工商银行股份有限公司 华为技术有限公司 浙江网商银行股份有限公司中国信息通信研究院 腾讯云计算(北京)有限责任公司新华三技术有限公司 蚂蚁科技集团股份有限公司中科寒武纪科技股份有限公司超聚变数字技术有限公司 北京百度网讯科技有限公司 前言 人工智能基础设施作为“新基建”的重要组成部分,是数字化走向智能化的核心力量,是金融机构智慧再造的关键载体。近年来,我国发布多项政策文件,进一步明确人工智能的发展规划,对人工智能算力建设指出方向。2021年底,中国人民银行发布 《金融科技发展规划(2022—2025年)》,提出抓住全球人工智能发展新机遇,以人为本全面推进智能技术在金融领域深化应用,着力打造场景感知、人机协同、跨界融合的智慧金融新业态,实现金融服务全生命周期智能化。 人工智能算力数据中心是以数据中心为基础的人工智能基础设施。具体来说,人工智能数据中心是在超算中心和云计算数据中心大规模并行计算和数据处理的技术架构基础之上,通过大数据和深度学习技术保障其高效、安全运营,以人工智能专用芯片为计算算力底座,融合公共算力服务、数据开放共享、智能生态建设、产业创新聚集“四位一体”的综合平台,可提供算力、数据和算法等人工智能全栈能力,是当前人工智能快速发展和应用所依托的新型算力基础设施。“数据、算法、算力、开放平台”是人工智能基础设施的核心内容,其中算力包括AI芯片、AI平台、智能计算中心等产品,提供高性能、低成本、绿色的计算能力是算力建设的关键目标。 本报告阐述了国内外人工智能算力建设情况,梳理了当前金 融数据中心人工智能算力建设面临的挑战,从整体上提出人工智能算力数据中心的架构,围绕基建、硬件及软件基础设施给出了人工智能算力建设指引,并进一步分析了传统与新型算力、数据中心算力与边缘算力、算力与网络等关键技术的协同建设问题,探索了人工智能算力数据中心绿色低碳运维模式,最后通过成功案例展望未来,以期为金融机构数据中心建设人工智能算力基础设施提供指引与参考。 关键词:人工智能、AI算力、人工智能算力数据中心、AI使 能软件、AI开发框架 目录 第一章发展背景和研究目标1 一、发展背景1 (一)国家政策及“十四🖂”规划要求1 (二)金融科技发展的基础支撑4 (三)国内外当前AI算力建设情况4 二、研究目标9 第二章面临的挑战和难点10 一、整体看10 (一)数据中心AI算力发展不均衡10 (二)数据中心AI计算能力不足10 (三)数据中心AI算力连接和协同能力不强10 (四)数据中心AI算力调度不灵活11 二、分层看11 (一)数据中心选址问题(L0层)11 (二)能耗及供电问题(L1层)12 (三)AI算力底座与周边设备及网络的问题(L2层)12 (四)支持不同业务场景的AI应用问题(L3层)13 第三章建设指引14 一、人工智能算力数据中心架构14 (一)总体架构14 (二)分层布局15 二、基建基础设施层(L0-L1)20 三、硬件基础设施层(L2)20 (一)AI芯片20 (二)AI服务器21 (三)AI计算子系统22 四、软件基础设施层(L3)22 (一)芯片使能软件22 (二)AI开发框架23 (三)使能软件23 第四章建设协同30 一、整体原则30 二、传统算力与新型算力协同30 (一)算力产品特征30 (二)算力协同建设32 三、数据中心算力与边缘算力协同37 四、算力与网络协同39 (一)广域算力网络架构40 (二)广域算力网络关键技术43 (三)数据中心算力网络关键技术44 (四)算力网络协同关键技术46 (🖂)算力网络数字化能力47 第五章运维和节能管理49 一、运维管理49 (一)人员组织49 (二)日常运行维护50 二、节能管理50 第六章成功案例和未来展望53 一、成功案例53 (一)工商银行基于高性能网络的中高算力集群探索53 (二)蚂蚁集团AI算力端云协同发展实践54 (三)网商银行基于卫星遥感的AI算力服务农村金融实践56 二、未来展望57 (一)AI算力的建设需求快速提升57 (二)AI算力的金融价值不断凸显58 参考文献60 第一章发展背景和研究目标一、发展背景 (一)国家政策及“十四🖂”规划要求 人工智能基础设施是“新基建”的重要组成部分,是数字化走向智能化的核心力量,是金融机构智慧再造的关键载体。“数据、算法、算力、开放平台”是人工智能基础设施的核心内容,其中算力包括AI芯片、AI平台、智能计算中心等产品,提供高性能、低成本、绿色的计算能力是算力建设的关键目标。 近年来,我国发布多项政策文件,进一步明确人工智能的发展规划,对人工智能算力建设指出方向。人工智能已上升为国家战略,人工智能的发展迎来重大机遇。表1汇总了近年来国家和相关部委发布的人工智能及算力相关政策。 表1人工智能及算力相关政策 时间 内容 2017年3月 国务院总理李克强2017年政府工作报告,指出要加快培育壮大包括人工智能在内的新兴产业,“人工智能”首次被写入了国家政府工作报告。 2017年7月 国务院出台《新一代人工智能发展规划》,提出三步走的战略目标。 2017年12 月 工业和信息化部印发《促进新一代人工智能产业发展三年行动计划(2018—2020年)》,明确了到2020年人工智能在推动战略性新兴产业总体突破、推进供给侧结构性改革、振兴实体经济、建设制造强国和网络强国方面的重大作用和具体目标。 时间 内容 2018年3月 国务院总理李克强在十三届全国人大一次会议作政府工作报告时表示,要加强新一代人工智能研发应用,在医疗、养老、教育、文化、体育等多领域推进“互联网+”。 2018年5月 习近平总书记在两院院士大会上指出,“要推进人工智能同实体经济深度融合,做大做强数字经济。” 2018年12 月 中央经济工作会议,重新定义了基础设施建设,把5G、人工智能、工业互联网、物联网定义为“新型基础设施建设”。 2019年3月 国务院总理李克强在《2019年国务院政府工作报告》中明确提出深化人工智能等研发应用。紧扣国家发展战略,加强新一代信息基础设施建设。 2019年7月 中央政治局会议,强调要加快推进信息网络等新型基础设施建设。 2020年3月 中共中央政治局常务委员会召开会议再次强调“新基建”,要求加强人工智能等新型基础设施建设。 2020年4月 国家发改委首次明确“新基建”范围,强调数据中心、智能计算中心就是算力基础设施的代表。 2020年7月 国家标准化管理委员会、中央网信办、国家发展改革委、科技部、工业和信息化部印发《国家新一代人工智能标准体系建设指南》,指导人工智能标准化工作有序开展。 2020年10 月 科技部印发《国家新一代人工智能创新发展试验区建设工作指引(修订版)》,明确要布局建设20个左右国家人工智能创新发展试验区。 2020年11 月 2020年11月17日,国家信息中心信息化和产业发展部发布《智能计算中心规划建设指南》,对智能计算中心的概念、内涵、技术架构、投建运模式等进行全面解读。 时间 内容 2021年3月 国务院发布《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》,提出要强化国家战略科技力量,加强原创性引领性科技攻关。新一代人工智能作为重要的科技攻关领域,重点投入前沿基础理论突破,专用芯片研发,深度学习框架等开源算法平台构建,学习推理与决策、图像图形、语音视频、自然语言识别处理等领域创新。 2021年5月 国家发展改革委、中央网信办、工业和信息化部、国家能源局联合印发《全国一体化大数据中心协同创新体系算力枢纽实施方案》,明确在京津冀、长三角、粤港澳大湾区、成渝,以及贵州、内蒙古、甘肃、宁夏等地布局建设全国一体化算力网络国家枢纽节点(以下简称“国家枢纽节点”)。 在金融行业,银保监会于2019年发布《关于推动银行业和保险业高质量发展的指导意见》,提出既要充分利用人工智能强化业务管理,改进服务质量,降本增效,又要发挥人工智能在打击非法集资、反洗钱、反欺诈等方面的积极作用。在相关宏观政策的指导下,各地结合自身区域特点和行业发展状况因地制宜出台相关政策推动智能金融的特色化发展,相关行业标准规范逐步完善。2021年,中国人民银行发布《人工智能算法金融应用评价规范》(JR/T0221—2021),规定了人工智能算法在金融领域应用的基本要求、评价方法、判定准则。金融行业以智能化为目标,提升金融数字化水平,通过业务流程自动化降低人力成本, 通过解决信息不对称问题弥合数据信息差,通过个性化的千人千面提供普惠金融服务,从而实现业务的增长、风险成本的降低、运营成本的改善。 (二)金融科技发展的基础支撑 金融科技发展提出人工智能、大数据分析等场景,响应金融监管政策的要求。2021年12月,中国人民银行印发《金融科技发展规划(2022—2025年)》,提出“坚持发展与监管两手抓,推动金融科技在实体经济的沃土中落地生根。大数据、云计算、人工智能、区块链等技术金融应用成效显著。金融服务覆盖面逐步扩大,优质金融产品供给不断丰富,金融惠民利企水平持续提升。” 人工智能作为金融机构数字化转型的重要手段,助力金融行业在产品设计、市场营销、风险控制、客户服务以及其他支撑性业务领域和场景中实现整体升级。《金融科技发展规划(2022—2025年)》在“智慧为民”基本原则中,提出“抓住全球人工智能发展新机遇,以人为本全面推进智能技术在金融领域深化应用,强化科技伦理治理,着力打造场景感知、人机协同、跨界融合的智慧金融新业态,实现金融服务全生命周期智能化,切实增强人民群众获得感、安全感和幸福感”,加快金融服务智慧再造,提升数字绿色的服务体系中的智能应用水平。 (三)国内外当前AI算力建设情况 1.国内外算力规模发展 2020年全球算力总规模达到429EFlops1,增速达到39%,其中基础算力规模为313EFlops,AI算力规模为107EFlops,超算算力规模(换算为FP32)为9EFlops。预估未来五年全球算力规模将以超过50%的速度增长,到2025年整体规模将达到3300EFlops。全球算力竞争激烈,基础算力方面以中国和美国为第一梯队,其中美国占43%份额,中国占26%份额。智能算力方面,中国智能算力占算力的比重由2016年的3%提升至2020年41%,以人工智能算力数据中心为代表的AI算力基础设施发展迅猛。《2020全球计算力指数评估报告》显示“全球计算力水平top5行业分别是互联网、制造、金融、政府和电信”,金融行业综合排名进入前三。 2.金融业务应用系统需求 在新一轮科技革命和产业变革的背景下,金融科技蓬勃发展,人工智能、大数据、云计算、物联网等信息技术与金融业务深度融合,为金融发展提供源源不断的创新活力。同时《2020全球计算力指数评估报告》显示“金融行业信息化和数字化起步较早,金融行业因对算力的稳定性、可靠性、实时性、安全性等方面要求较高,对于算力的投资规模处于行业领先水平且比较稳定。从全球来看,金融行业是人工智能算力投资最大的传统行业,据IDC数据,全球AI算力支出的24.9%来自金融行业,人工智能作为金融行业数字化转型过程的关键部分,被广泛用于