前言 存力中心是将数据存力进行集约建设,提供高可靠、高性能、高安全的数据存储与管理服务的一种数据中心建设模式。在当今大数据、AI、区块链等技术迅速发展,数字化、智能化转型进程加速推进的背景下,数据呈现指数级增长,各行业对数据量与数据质量的需求也逐渐提升。存力中心不仅承载着大规模数据的存储需求,也对高效数据处理、分析、挖掘等技术领域起到重要支撑作用,同时依托其良好的扩展性,可以有效应对不断增长的数据量和业务需求,是推动未来数据经济与社会发展的关键力量。 目前存力中心已经在政务、金融、医疗、教育等多个行业发挥作用,并且随着技术的不断进步和数字化应用的推进,存力中心将在未来的数字经济中扮演更加关键的角色。因此,现形成《存力中心典型案例集》以供交流推广,向业界分享先进的数据中心建设模式与运营经验。案例集从建设背景与发展现状两方面介绍我国当前存力中心建设情况,并列举了全国范围内具有典型特征的存力中心建设部分优秀案例,案例选择上力求广泛性和代表性,涵盖了国家重大战略主导的全国一体化算力网络枢纽节点存力中心、由政企联合建设并对当地发展起到积极推动作用的存力中心以及行业领军企业自建的私有化存力中心等多种类型。旨在通过对典型案例的收集与分析,总结其建设情况、技术创新及应用成效等方面内容,为相关领域从业者、研究人员与政策制定者提供参考。如有意见或建议请联系中国信通院云大所数据中心团队,邮箱:dceco@caict.ac.cn。 目录 前言I 目录II 图目录III 1.存力中心的建设背景1 1.1数字经济的快速发展带来数据规模激增1 1.2我国数据产业与应用潜力尚未完全发挥1 1.3人工智能技术发展对数据提出更高需求1 1.4数据孤岛问题阻碍数据价值的有效释放2 2.存力中心的发展现状3 2.1我国高度重视数字基础设施建设3 2.2业界积极发起存力中心行动计划3 2.3存力中心建设优势开始逐步展现4 3.优秀存力中心案例展示5 3.1鸿翼名人院士数字人训练存力中心5 3.2贵州主枢纽存力中心暨数据要素保障基地8 3.3国网陕西信通公司信息运维中心11 3.4霸州数据要素产业园存力中心13 3.5拉萨先进存力中心17 3.6科大讯飞AI先进存储中心20 3.7中国移动长三角(上海)临港数据中心24 4.展望与建议27 4.1鼓励技术创新与研发投入,加速存储产业全面发展27 4.2加强区域数据流通与应用,推动数据价值深度挖掘27 4.3完善标准与评估体系制定,引导数字基建高质量建设27 图目录 图1数据要素保障基地项目架构图9 图2拉萨先进存力中心架构图18 图3科大讯飞先进存储中心结构图21 1.存力中心的建设背景 1.1数字经济的快速发展带来数据规模激增 在数字经济快速发展的时代背景下,随着信息技术的广泛应用,特别是互联网、大数据、云计算和人工智能等技术不断突破,全球数据量正以前所未有的速度增长,数据已成为最宝贵的资源之一。存力中心旨在确保数据资源的有效存储、管理和利用,避免数据的无效损耗,保障数据资产安全,为数据资源的深度挖掘与价值转化提供坚实的物理和技术支持。存力中心的建设不仅是对海量数据资源存储需求的直接响应,更是对数字经济时代下数据作为生产要素日益增长的重要性的认识,通过先进、高效的数据存储方案,促进数据资源向数据资产转变,为数字经济高质量发展提供动力。同时,存力中心作为数字技术与实体经济融合的桥梁,也为传统产业的数字化转型、催生新产业、新业态和新模式提供了有效支撑。因此,存力中心不仅是技术进步的必然结果,也是经济社会发展的要求,对于构建现代化经济体系、实现可持续发展具有重要意义。 1.2我国数据产业与应用潜力尚未完全发挥 随着我国数字经济的蓬勃发展,数字化转型取得显著成效,但我国海量数据资源和丰富应用场景优势的潜力仍有待释放。在市场供需方面,数据交易领域展现出强劲的需求动力,根据调查显示2023年需求方数量是供给方的1.75倍,数据产品的成交率仅为17.9%,场内交易供需匹配度低,数据供给难以满足市场旺盛的需求。同时,海量数据分散存储也增加了数据价值挖掘的难度,有高达38.93%的数据自产生以来从未被有效利用1。。目前,我国企业遍存存在重重数据项目建设、忽略数据资源管理的现象,数据价值的激活成为重大挑战。存力中心的数据存力集约化建设模式为数据管理、数据融合、数据挖掘提供了良好的基础,是加速数据要素价值释放的有效途径。 1.3人工智能技术发展对数据提出更高需求 人工智能技术作为新一轮科技革命和产业变革的重要驱动力,正深刻地改变 1《全国数据资源调查报告(2023年)》全国数据资源调查工作组 着人类的生产和生活方式。目前人工智能技术已经在医疗、教育、金融、交通等多个领域展现出其巨大的潜力和价值。当前,人工智能技术正沿着追求更高精度推理结果、更高难度场景任务、更广范围能力边界等方向持续演进。特别是在大模型技术领域,对数据的需求量和质量要求持续攀高,所需高质量训练数据规模已经达到TB甚至PB级别,训练数据类型也从单模态向多模态转变。存力中心通过对广域数据的集中存储和统一管理,可为智能模型提供强大的数据资源储备,也为人工智能技术的应用创新提供坚实基础。未来随着AI技术的进一步发展和智能应用场景的不断拓展,存力中心的建设和发展将持续受到重视,并在推动人工智能等数据科学领域技术创新和应用方面持续发挥关键作用。 1.4数据孤岛问题阻碍数据价值的有效释放 数据孤岛现象是指数据分散存储在不同系统、平台或部门间无法有效共享和整合,当前这种现象遍存存在于企业内部和不同企业之间。数据的分散存储限制了数据的互联互通、多场景应用及多主体间的复用,数据的潜力很难得到充分发挥,数据要素价值亟需释放。存力中心对海量数据资源进行归集融合,推动从分散的小规模数据向规模化、多样化发展,是对数据资源进行高效管理和充分利用的关键措施。另外,根据梅特卡夫定律,资源的汇聚互联能够激发其内在价值的指数级增长,形成显著的“规模效应”,激发出数据的更多价值。因此,存力中心的建设模式有助于打破数据孤岛,降低数据存储和处理的成本,提高数据资产的利用效率,促进数据要素的流通和交易,进一步激发数据市场的活力,实现从“存数”到“用数”的转变。 2.存力中心的发展现状 2.1我国高度重视数字基础设施建设 党的十八大以来,我国高度重视数字基础设施的建设与发展,不断加快完善人工智能、数据中心等领域的建设布局。2024年7月18日,二十届三中全会通过了《中共中央关于进一步全面深化改革、推进中国式现代化的决定》,强调要培育全国一体化技术和数据市场,加快构建促进数字经济发展体制机制,打造具有国际竞争力的数字产业集群,建设和运营国家数据基础设施,推进传统基础设施数字化改造。作为数字经济的重要推动力之一,发展数字基础设施成为全要素数字化转型的重要前提。2024年8月,在工信部发布的《关于推动新型信息基础设施协调发展有关事项的通知》中提出,要加强全国统筹规划布局,优化面向全国提供服务的重大关键基础设施的布局,引导面向全国、区域提供服务的大型及超大型数据中心在枢纽节点部署。加强本地数据中心规划,深入落实区域协调发展战略和区域重大战略,加强新型信息基础设施区域统筹,深化跨省市规划衔接和建设合作等重要指示。国家政策的发布为存力中心建设提供了全面的支持和方向指引,通过提升数字基础设施建设和应用,推动数字经济和实体经济的深度融合,为经济社会的高质量发展提供坚实的支撑。 2.2业界积极发起存力中心行动计划 在2023年中国算力大会上,由清华大学国情研究院联合贵安产控资本投资有限公司、上海鸿翼、中安星云及华为等机构共同发起了“存力中心行动计划”,该计划旨在推动数算一体化存力中心的建设,以支持数字中国的高质量发展。计划致力于将传统的以建设为主的数据中心模式转变为以运营为中心,强化业务填充率和数据的可获得性与可用性,从而提升数据中心对数字经济的贡献。同时,强调了数据资产的重要性,提出将存力中心打造成集合数据归集、保护、治理、开发加工和供给的中心,实现数据全生命周期的高效管理。同时,该行动也推动了数算一体化发展,加强数据存储与计算能力之间的协同,提供持续的高质量数据供给,在支持算力中心和AI大模型的发展,促进产业生态聚集,推动传统产业的数字化转型和升级等方面有重要意义。 2.3存力中心建设优势开始逐步展现 目前我国已建成一批全国一体化算力网络枢纽,这标志着新型数据基础设施建设从规划走向了实际应用。例如,贵州存力中心采用“1114N架构”,即1个国家级数据要素保障基地、1个先进存力中心和多元算力中心构成的新型数据基础设施、1个国家级数据资产中心以及4个数据要素平台,服务于N个应用场景,涵盖了数字人、智能网联汽车、医疗影像、智能仓储物流、知识智能、智慧教育、空间大数据赋能文化产业、AI数据治理与授权运营管理等多个领域。这些场景的应用将进一步推动数据要素的价值释放和数字经济的发展,实现以技术创新推动产业发展,以应用效果带动技术创新的良性循环。除贵州外,我国还建成了西藏拉萨存力中心、宁夏中卫存力中心等关键枢纽,有效推动了海量数据资源的汇聚、开发与共享复用,进一步释放数据作为生产要素的潜力与价值,加速我国从数据大国到数据强国的发展进程。 3.优秀存力中心案例展示 3.1鸿翼名人院士数字人训练存力中心 1、基本信息 鸿翼名人院士数字人训练数据要素存力中心专注于教育行业,可提供15PB的分布式存储能力。在算力方面,中心配备12台通用算力服务器,以满足数据处理和分析的需求。网络连接方面,中心采用20GE高速网络,确保数据传输的快速和稳定。 2、企业简介 鸿翼名人院士数字人训练存力中心的运营主体为航天鸿翼(浙江)数据科技有限公司(以下简称“航天鸿翼”),航天鸿翼是面向数据要素产业的全栈能力数据服务运营商。业务覆盖数据中心建设以及军队、军工与国央企业务。航天鸿翼以打造数据要素产业为战略支点,以国产化、智能化、网络化、绿色化、安全稳定为导向,在当地先行打造全国先进绿色枢纽样板,通过为用户提供数据灾备、数据治理、数据加工、数据管理等服务,深入挖掘枢纽作用,最终实现搭平台、建产业、促发展的社会效益,逐步在全国布局存力中心“一张网”,推动可持续性的数字化转型。 3、应用背景 在大数据时代,数字人技术正在不断地进行迭代更新,随之而来的是对数据量需求的逐步扩大。随着技术的进步和应用的遍及,数字人技术在各领域得到了广泛的应用,从虚拟助手到虚拟偶像,再到各种模拟现实的应用场景。数字人技术依赖于大量的数据来训练和优化算法,这些数据包括用户的个人信息、行为习惯、语音和图像等。如果这些数据被未经过授权的第三方获取或滥用,可能会对用户的隐私造成严重威胁。因此,如何在大数据时代保护数字人数据安全和隐私已经成为一个亟需解决的问题。 为了应对这一挑战,鸿翼建设名人院士数字人训练存力中心,专门用于存储和处理与名人院士数字人相关的数据。各国政府也在制定相应的法律法规,以规范数字人数据的收集、存储和使用,确保用户的隐私权益得到充分保护。数字人训练存力中心采用最先进的技术和严格的安全措施,结合技术手段和法律法规的 双重保障,确保数据的安全和隐私得到保护。 4、关键技术和创新点 鸿翼名人院士数字人训练存力中心通过数据存储多维度的安全根技术构筑数据底座,端到端消除数据安全与合规风险,守护数据内容安全,明确个人数据边界,并为个人数据提供归集、加工、可信托管等多样化服务,实现了以存为主,存处结合的安全可信数字人训练基地。 关键技术和创新点如下: (1)存储内生安全构建多维度数据安全根技术 依托数据存储的内生安全、数据空间、数据防勒索、数据脱敏、数据安全销毁等多维度安全根技术构建安全可信的数字人训练存力中心,端到端确保数据的安全性与合规性,消除用户数据潜在的安全风险,确保数据的完整性与机密性。同时,项目明确个人数据的边界,确保用户对自己的数据有充分的控制权和隐私保护。存力中心不仅为用户提供安全可靠的数据存储环境,还为用户提供明确的