—3— 引言 INTRODUCTION 习近平总书记指出,要加快新型基础设施建设,推动数字经济和实体经济融合发展。随着数字经济时代全面开启,算力正以一种新的生产力形式,为各行各业的数字化转型注入新动能,成为经济社会高质量发展的重要驱动力。算力基础设施作为算力的主要载体,是支撑数字经济发展的重要资源和基础设施,对于实现数字化转型、培育未来产业,以及形成经济发展新动能等方面具有重要作用。 AIDC的建设得到了国家层面的明确支持与指导。2020年,国家发改委将智能计算中心纳入新基建范畴,激发了各地投资热潮,AIDC由此进入快速扩张期。2021年,国家相继发布了多项规划,包括《新型数据中心发展三年行动计划 (2021-2023年)》、《“十四五”国家信息化规划》以及《“十四五”数字经济发展规划》,这些规划进一步推动了AIDC的有序发展。到了2022年,国家政策引导力度进一步增强,特别是“东数西算”项目的提出,加强了算力资源的统筹与智能调度。2023年,中共中央、国务院发布的《数字中国建设整体布局规划》强调了系统优化算力基础设施布局的重要性,促进了东西部算力的高效互补与协同联动。 随着政策支持力度的加强以及人工智能技术的迅速发展,对算力的需求持续增长,AIDC的建设变得尤为关键。AIDC不仅提供强大的计算能力,还支持数据服务和算法服务,为人工智能的应用与创新提供关键支撑。AIDC的建设和发展已成为推动数字经济和智能化升级的关键力量,也是实现国家人工智能战略和科技创新的重要举措。在中国,AIDC作为新型基础设施的重要组成部分,正成为推动经济社会发展和科技进步的重要引擎。 因此,超云数字技术集团有限公司联合宁夏西云算力科技有限公司,与时俱进,聚焦AIDC基础设施规划、建设、运营,编制了《AIDC基础设施建设白皮书》,为AIDC基础设施建设提供参考。 PART1 AIDC概述 —1— —1— PART1|AIDC概述 AIDC定义 AIDC(ArtificialIntelligenceDataCenter),即人工智能数据中心,是指集成了高性能计算能力、大数据处理能力、人工智能算法和云计算服务的综合信息处理中心。作为新时代信息技术发展的关键基础设施,AIDC能够为政府、企业、科研机构等各类用户提供强大的数据处理和智能分析能力,支持智慧城市、智能制造、科研计算等多样化的应用场景,是推动社会信息化和智能化转型的重要力量。 AIDC建设背景 AIDC的建设是应对当前及未来计算需求的关键举措,对于推动科技进步、经济增长和社会发展具有重要作用。随着技术的持续进步和应用场景的不断扩展,AIDC的建设和运营正在不断进行优化和升级,以适应新兴的挑战和需求。AIDC的建设背景可以从政策支持、技术发展和应用需求等多个维度进行阐述。 _政策背景 在全球化和数字化的大潮中,众多国家将AIDC建设提升至国家战略的高度。以中国为例,“十四五”规划和2035年远景目标纲要明确提出加快数字化发展,并将AIDC等新型基础设施的建设列为重点任务。国家层面发布的《“十四五”国家信息化规划》和《“十四五”数字经济发展规划》均强调了推动智能计算中心有序发展的必要性。 政府为支持AIDC的建设和运营,出台了一系列政策,涉及资金支持、税收优惠、土地使用等方面。工业和信息化部联合其他五个部门印发了《算力基础设施高质量发展行动计划》,旨在推动算力基础设施的高质量发展。国家发展和改革委员会出台的《智能计算中心规划建设指南》为AIDC的规划建设提供了明确的方向。此外,北京、浙江、四川、广东、上海、山东等多个省市也相继发布了相关政策规划,形成了央地协同推进AIDC发展的格局。 _技术背景 数字化转型的深入推动了对智能算力需求的大幅增长,预计未来80%的经济活动将依赖于人工智能。AIDC作为新型基础设施,其建设显得尤为迫切。人工智能技术的演进正从单模态智能向多模态融合迈进,AIDC在这一过程中扮演着核 心角色,成为推动通用人工智能发展的关键力量。 算力经济的兴起和人工智能技术的融合创新,使AIDC成为新基建的热点。AIDC的建设不仅满足了日益增长的人工智能算力需求,而且在促进AI产业化、赋能产业AI化、支持治理智能化等方面发挥了重要作用。AIDC的发展正在逐步构建一个普适普惠的服务生态,包括算法应用的普及和算力服务的普及,这将为各行业的智能化升级提供助力。 _应用背景 AIDC的创新发展对推动人工智能及相关产业的快速增长具有显著影响,成为经济增长的新引擎。据《智能计算中心创新发展指南》预测,“十四五”期间,城市对AIDC的投资有望带动人工智能核心产业增长约2.9至3.4倍,相关产业增长约36至42倍。 智慧城市建设、科学研究以及传统产业的数字化和智能化升级,都对数据分析和智能决策支持提出了更高要求。AIDC能够提供必要的计算资源、支撑基础和技术支持,从而推动人工智能技术的广泛应用,并加速科研创新和产业升级。 AIDC的建设是数字化转型的加速器和智能经济的基石,已成为推动社会进步和经济发展的大势所趋。 PART2|AIDC䒊霃ⴔ區 —4— PART2 AIDC建设分析 建设原则 AIDC的建设不仅仅是基础设施的搭建,需要综合考虑建设基础和当地的经济状态、产业特点等。AIDC规划建设应遵循以下几个关键原则: 提供公共服务优化产业布局 AIDC旨在将智慧计算服务普及至基本公共服务,如水电一样,提供公共的算力、数据和算法服务。在建设规划中,应综合考虑国家重大区域发展战略、能源结构、产业布局、市场发展和气候环境等因素,对国家枢纽节点、省内数据中心、边缘数据中心、老旧数据中心及海外数据中心进行分类引导,以形成数据中心的梯次布局。 加速产业升级激发经济活力 AIDC致力于通过降低AI应用成本、提升算力效率,促进AI生态的对接和创新产业的聚集,加速产业的转型升级,以及数字经济与传统产业的深度融合,全面激发经济的智能活力。AIDC以5G、工业互联网、云计算、人工智能等技术的应用需求为牵引,整合多元数据资源,提供安全可靠的算力服务,赋能各行各业。 技术领先生态多元 AIDC采用尖端AI芯片和面向新型AI场景的计算架构,基于AI模型提供高强度的数据处理和智能计算能力,构建技术领先、可持续迭代升级的高性能、高可靠的计算架构。AIDC注重技术领先和多元算力生态的共同支撑,全面支持人工智能技术的应用和演进。 绿色低碳安全可靠 AIDC坚持绿色发展理念,推广绿色技术和产品,采用清洁能源,并致力于提高能源利用效率。AIDC在推进发展的同时,也高度重视安全保障,通过强化网络和数据的安全管理体系,构建全面且稳固的安全防护架构。 这些原则旨在推动AIDC的高质量发展,构建以AIDC为核心的智能算力生态体系,有效支撑各领域的数字化转型,为经济社会提供高质量的发展动能。 PART2|AIDC䒊霃ⴔ區 建设方式 AIDC建设的具体实施步骤会根据项目规模、地点、投资主体等变量而有所差异,但一般涵盖以下几个基本阶段。 1 项目规划与可行性研究:开展市场调研以评估需求和潜在用户群体;明确AIDC的目标与功能,包括所需的计算能力、数据存储与处理需求;执行技术和经济可行性研究,评估项目的可持续性与盈利模式。 2 选址与环境评估:综合考虑能源成本、气候条件、网络基础设施等因素,选择最佳地点;进行环境影响评估,确保项目符合环保和可持续性标准。 3 资金筹集与投资结构确定:依据项目需求确定资金来源,可能包括政府资助、企业投资、银行贷款等;制定投资结构,明确股权分配和投资回报机制。 4 设计与建设:委托专业机构进行AIDC设计,确保技术领先和未来可扩展性;选定建筑和IT基础设施供应商;监督管理建设过程,确保建设质量和工程进度。 5 设备采购与安装:根据设计规范采购所需的高性能计算设备、存储系统、网络设备等;执行硬件和软件系统的安装与配置。 6 运营准备与人员培训:组建运营团队,制定运营策略和管理流程;对运营人员开展专业培训,以确保AIDC的有效管理。 8 7试运营与优化:启动试运营阶段,收集用户反馈,对服务进行优化;调整运营策略以更好地满足用户需求。正式运营与持续改进:AIDC正式投入运营,提供计算服务;定期评估服务效果,并根据技术进步和市场变化进行必要的升级与改进。 完成这些步骤需要跨学科的专业知识,涉及计算机科学、建筑学、项目管理、金融学和环境保护等领域,通常需要多学科专家和团队的紧密合作。 应用场景 AIDC的应用场景极为广泛,覆盖了多个行业和领域,此处以智慧金融和智慧医疗为例,介绍部分应用场景。 风险管理:利用大数据分析和人工智能算法,金融机构能够更精准地识别和评估包括信贷风险、市场风险和操作风险在内的各类风险。这些技术有助于预测市场趋势、侦测欺诈行为、评估客户信用状况。 算法交易:AIDC可以支持资本市场的高频和算法交易策略的开发与执行。机器学习使交易系统能够从历史数据中学习,并实时作出交易决策。 客户服务:AIDC可以支持智能客服系统的构建,实现全天候客户服务,通过自然语言处理技术理解并响应客户的询问和需求。 反洗钱和客户分析:人工智能技术强化了反洗钱和客户身份识别流程,通过分析大量客户数据可以快速识别可疑交易和行为。 智慧金融 疾病诊断与预测:通过分析海量医疗数据和图像,辅助医生更准确地诊断疾病,如癌症、心脏病等,并预测疾病的发展趋势。 药物研发:应用机器学习和数据挖掘技术,可以加速新药的发现和开发,降低研发成本和风险。 医疗影像分析:利用人工智能技术自动分析医疗影像,如X光、CT扫描和MRI图像,协助医生迅速识别疾病的½兆。 健康管理和预防:通过大数据分析,提供健康管理和预防性建议,助力公众改善生活方式,预防疾病的发生。 智慧医疗 这些应用场景展现了AIDC在金融和医疗行业中的深远影响。类似地,其他行业也在进行智慧化升级,但由于篇幅限制,此处不再详细列举。 PART3|AIDC㛇炄霃倶 —8— PART3 AIDC基础设施 通用计算资源池主要用于传统HPC业务,异构计算资源池则用于进行AI训练推理等相关业务。异构计算节点采用的异构加速芯片多种多样,主要包括GPU、FPGA、ASIC等,主流的厂商有NVIDIA、AMD、Intel,国内的加速芯片厂商主要有昇腾、天数、昆仑芯、寒武纪等。 分布式存储资源池负责存储和管理大量的数据资源,为智算任务提供必要的数据支持。通用计算资源池则提供通用的计算能力,支持各种计算密集型任务的处理。 数据传输网是AIDC中各个组件之间数据传输的通道,它确保数据在AIDC内的快速、准确传输,通常使用RoCE技术或者IB网络来实现低延时、无丢包的高性能网络通信,从而保障AI集群的高效率运行。运维管理中心则负责对整个AIDC进行监控和管理,确保系统的稳定运行。 此外,AIDC的逻辑拓扑还可能包括其他辅助组件,如安全管理模块、网络管理模块等,这些模块共同提升AIDC的安全性和可靠性。 _AIDC评价指标 AIDC评价指标是衡量AIDC性能、效率和绿色化程度的一系列标准,对于AIDC的规划、建设和运营至关重要。AIDC评价指标可以根据其衡量的内容分为以下几个类别: 能源效率指标 PUE(PowerUsageEffectiveness):衡量AIDC能源效率的指标,反映AIDC用于IT设备的实际功率与总能耗的比例。 计算公式为:PUE=总耗电/IT设备耗电。 注:PUE值越接近1,表示AIDC的能源效率越高 水资源效率指标 WUE(WaterUsageEffectiveness):衡量AIDC水资源使用效率的指标,反映数据中心总耗水量与IT设备耗电量的比值。 计算公式为:WUE=(总耗水)/IT设备耗电 注:WUE数值越小,代表AIDC耗水量越低 PART3|AIDC㛇炄霃倶 环境影响指标 CU