数据中心 2030 1 构建万物互联的智能世界 序言 郑纬民 科技发展的速度远超我们的想象,就像一些学者提到的:指数型技术融合将打开下一个十年人类社会发展的新版图,人们生产生活的方方面面都将在这个新版图中变化和变革,最新的具备这一特征的指数型技术就是人工智能。预计我国在2025年人工智能产业规模将超过4500亿元,带动产业规模超 过1.6万亿。 人工智能产业的“三驾马车”分别是数据、算法和算力。最近大家都比较关注GPT系列AI大模型的创新,业界称为计算领域的“iPhone时刻”。其背后主要依赖AI大集群算力基础设施,大模型的AI训练集群NPU算力规模达几千张卡,甚至上万张卡。算力已经成为人工智能、元宇宙的第一关键要素,在数字经济中扮演着越来越重要的角色。 算力集群主要是3类,即高性能计算算力集群(HPC/超算计算中心)、人工智能计算算力集群(AI计算中心或智算中心)以及通用计算算力集群(云与大数据数据中心),过去这3类算力集群以烟囱化建设模式为主,未来将走向融合建设的模式。比如:HPC+AI可以极大的提升传统HPC的计算效率,短期天气预报就是一个融合AI、大数据和科学计算的典型实例。未来,新型数据中心将是提供多样性计算综合能力的算力集群,以满足千行百业智能化的需求。 同时,未来数据中心的发展还要考虑不同地区能源结构的差异、同一地区不同行业的业务差异,提供更绿色的算力,并满足实时应用的需求。算力的互联互通和统一调度是实现“东数西算”的一项基本条件,更是数据中心算力发展的必由之路。在当前的应用场景中,带宽不足导致的延迟是算力互联无从避免的局限性。按照目前的架构,举例来说,如果要将4TB的原始数据从北京传输到无锡,即使使用目前最快的网络,并保证网络无故障的情况下,数据传输时间将高达5天。中国创新的提出了“算力网络”的概念,旨在通过网络将全国各个算力中心连接起来,形成一台庞大的“网络计算机”。一方面要提高算力输送效率,通过并网实现高带宽、低延迟的算力互联;另一方面,需要团结领域内各大企业,可以屏蔽异构基础设施的差异,通过统一编程框架和编译的资源管理与调度软件实现算力的互通和资源的统一调度和管理,稳步推进“东数西算”的发展与预后工作。实现全社会算力资源的使用最优、效率最高。 本次,华为结合自身在ICT领域30多年的技术创新思考,以及10多年来帮助IT行业客户构建数字基础设施的实践,组织内外部的技术专家进行了多轮的讨论,编写了这份《数据中心2030》研究报告。围绕2030年数据中心的应用场景及发展方向,系统性地阐述了未来数据中心的关键技术特征,并首次提出了未来数据中心是一台满足“能效、算效、数效、运效、人效”5效的计算机,并指出了算、存、网融合创新的方向,最后还描绘了新一代数据中心的参考架构,对相关产业具有重要的参考意义! 未来十年,以大数据、AI、元宇宙等为代表的智能世界将加速到来,在迈向更美好的智能世界的征程中,数据中心基础设施的建设和发展将越发重要。从多样性算力的融合,到算力的互联互通,都需要全行业的持续探索与创新,汇众智、集众力,让我们大家齐心协力,助力全球计算产业的高质量发展和人类社会数字经济的腾飞! 中国工程院院士 序言 JoeWeinman 人工智能(AI)指机器具备执行通常需要人类智慧才能完成的任务的能力,如推理、学习、决策和创意。AI可能会颠覆人类社会的方方面面,比如经济、教育、健康、安全和文化等。 上面这段话其实是由AI聊天机器人所写,佐证了上述观点。由此可见,人类的能力与新兴数字技术之间的界限越来越模糊。但不仅是AI,几乎所有技术的性价比似乎都在加速提高,亦或在数十年毫无进展或只有些许进展后,某项技术突然颠覆整个市场—进化生物学家称这种现象为“间断平衡”。此类例子在信通技术行业不胜枚举,包括大语言模型(LLM)、扩散模型、区块链、Web3、量子计算、新通信协议、神经形态芯片、软体机器人、群体智能、同态加密等。这些技术通过新的方式联合应用,会变得更强大,而且会在现有的平台和生态系统(如云计算、移动设备和互联网)中加快普及应用。 这些新兴技术的用途无穷无尽,但根据其战略性应用能创造的竞争优势,我们可以将这些技术大致分为四大类,我称其为“新动能,新法则”:信息优势、方案领袖、亲密联盟和加速创新。 信息优势指利用数字技术改进流程、资源利用和组织结构。例如,算法能规划和修订最优物流路线,基于AI的解决方案能更迅速、可靠且稳定地获取更准确的放射诊断结果。 方案领袖将智慧化、数字化、互联的产品和服务在定制化和扩展性方面的潜能发挥到极致,应用到例如智慧家居、医院、港口和城市中。 亲密联盟利用数百万或数万亿个数据点来创建高度个性化的服务。算法可以通过分析浏览数据来推荐内容,通过分析购买数据来推荐交叉销售,或通过分析诊断、遗传、表观遗传、微生物和药理学数据为病人定制专属疗法。 加速创新则是通过数字技术让创新变得更快、更便宜、更好。例如,AI能快速梳理几十万篇科研论文和实验结果,确定蛋白质结构和动力学,从而加速药物研发。 然而,哪怕用最先进的算法处理最全面的数据集并用到最好的应用中,这个应用最终也必须在现实世界中执行。因此,架构集中型企业、云数据中心以及分布式边缘计算和设备(包括处理、存储、网络、安全和管理模块)必须协同工作,才能大规模高效运行这些应用。这些设施必须满足成本、性能、实施计划、可靠性、安全性、可视性、可管理性、隐私性和可持续性等一系列目标,并且必须具备灵活性和前后向兼容性,以适配目标的变动。 当今世界竞争激烈,技术、产品和服务快速更新换代,各种经济和自然因素的干扰以及善变的客户都意味着企业必须不断进行战略评估并持续推进数字化转型。方方面面的市场动态研究都表明,企业不能安于现状。 有鉴于此,华为的《数据中心2030》报告提供了未来十年技术与解决方案的宝贵路线图,列举了行业面临的关键问题,同时以清晰易懂的语言总结了可供IT经理或CIO选择的各种方案及其相关的权衡取舍。该报告涵盖了网络连接战略和分布式计算结构,从水下数据中心到未来的太空数据中心,同时探讨了绿色能源战略和动态微电网,重点介绍了云-边-端相关的选择,并涵盖了其他十几个主题,对规划当前或未来十年数据中心有重要的指导意义。 虽然有些人可能会认为这些见解过于详细,但不可否认的是,小到在车库里成立的初创企业,大到整个国家,在经济上的成功几乎都与数字能力的成功实现和执行密不可分。今年,全球经济规模将超过100万亿美元。尽管各国的数字化程度不同,“数字化”的标准也各异,但据估计,从巴西的灌溉传感器到尼日利亚的移动支付,从印度的鱼市到中国的超级计算机,数字化的比例达到了10%、23%和65%不等。为了在数字经济乃至全球经济中更好地生存和发展,任何管理决策者都有必要明确其公司的战略和竞争态势,专注于发展数字优势,并学习《数据中心2030》报告,将这份报告的洞察付诸实践,以最优地实施并调整公司的战略、执行和路线图。如何迎接未来?有效的规划和迅速的调整是最好的准备。 数字战略家 《云经济学》、《新动能新法则》作者 XFORMA首席执行官 序言 JerryKaplan 我初次邂逅云计算还是在20世纪60年代末的一次夏令营。当时,其他一起参加夏令营的小伙伴们纷纷被多彩的活动吸引:各种体育运动、丛林远足、或者在清凉的湖水中游泳,我却被突然出现的33型电传打字机吸引住了。这台终端通过电话线连接到数百英里外一台运行达特茅斯分时系统 (DartmouthTimeSharingSystem)的中央计算机上。在简单了解了BASIC计算机语言的入门基础后,我对计算机的兴趣就一发不可收拾。那个暑假的大部分时间,我都呆在昏暗的地下室里,编写一个玩“21点”纸牌游戏的程序。可惜当夏令营收到电脑和电话账单时,我的青少年程序员职业生涯便戛然而止了! 我再次接触云计算已是大约10年后,那时我还是宾夕法尼亚大学计算机科学专业的研究生。我当时的AppleII个人电脑处理文字和电子表格还行,却不具备高级人工智能程序(如我为写博士论文开发的自然语言查询系统)所需的处理能力。我的程序只能在大学里唯一的一台大型主机上运行,而且几乎占用了那台主机所有的CPU运行时间和内存。很快,学校里的IT人员开始接到其他用户的投诉,抱怨他们的程序运行太慢(或根本无法运行),于是我被迫只能在晚上工作,毕竟晚上机器还有可能是空闲着的! 与那时相比,现在计算和数据存储的成本已经下降了一百万倍以上。(我现在的手表所拥有的计算能力和内存都超过当时整个大学的。)鉴于这一惊人的进步,你或许认为,在可预见的将来里,我们所拥有的算力满足所有的客户需求根本不在话下,而且成本极低。然而,新一轮人工智能的浪潮再次提高了对计算基础设施的要求,给供应商们带来了巨大的挑战。据估计,训练一个生成式AI大模型 (GPT-4)需要使用2.5万个GPU,耗时90–100天,耗费超过1亿美元。而这样的一个程序只是目前全球正在开发的众多此类程序的冰山一角! 风趣的英格兰温莎公爵夫人华里丝·辛普森(WallaceSimpson)在1936年时说过一句名言,“钱再多也不嫌多,人再瘦也不嫌瘦。”同理,我认为,计算资源永远都不嫌多。不管数据中心的效率再怎么提升,GPU和云计算设施的数量再怎么增多,在日益数据化驱动的未来,算力依旧会供不应求。 作为全球数据中心产业的领导者,华为已经做好充分准备,去抓住这一趋势带来的机遇。华为在技术创新、扩大容量和降低成本方面的不懈努力,堪称业界典范,充分彰显了一家企业如何通过开发可靠、即插即用的基础设施去赋能亟需算力的未来,从而服务社会。 本报告的撰写基于与客户、多个研究机构及其他重要参与者的充分磋商,它提供了一份当下最迫切需要的路线图,确保数据中心计算能长期保持快速增长。无论您是从事商业、研究、娱乐、制造还是任何其他数据密集型行业的工作,我都鼓励您充分利用这次机会,了解华为的数据中心愿景,以助您所在的组织在大数据和AI时代笃定前行、脱颖而出。 硅谷创新企业家 作家人工智能专家 序言 汪涛 创新涌现,拥抱智能时代 在AI大模型训练过程中,当模型大到一定规模之后,性能会发生突变,开始呈现指数级快速增长,科学界称这个现象为“涌现”。正是这个性能的突变,让人工智能的发展阶段从感知理解世界到生成创造世界,这也造就了ChatGPT的火热,催生了面向行业的数百个AI大模型的出现。今天,“百模千态”正走向每一个行业、每一个场景、解决客户每一个问题,加速千行万业的智能化转型。人工智能的“涌现”时刻即将出现,人类社会也将迎来一个波澜壮阔的智能时代。 迈入智能时代,最大的需求是算力,最关键的基础设施是数据中心。根据华为《智能世界2030》报告预测,2030年,人类将迎来YB数据时代,对比2020年,通用算力将增长10倍、人工智能算力增长500倍,算力需求十年百倍的增长将成为常态。数据中心作为人工智能、云计算等新一代信息通信技术的重要载体,已经成为新型数字基础设施的算力底座,具有空前重要的战略地位,堪称“数字经济发动机”。 一边是算力需求以远超摩尔定律的陡峭增长,而另一边却是多重的资源约束。单芯片摩尔定律的失效、以及全球可持续发展目标下对于碳减排的要求,将迫使未来的数据中心必须在更优的计算架构、以及更低的能耗下产生更大的算力。回顾信息通信技术产业的发展历史,每一次跃升都是矛盾驱动的结果。过去三十年,超大宽带与成本约束的矛盾推动了联接产业的高速发展,5G、F5G等改变世界;未来三十年,将是超强算力与资源约束的矛盾推动计算产业的高速发展,AI、云计算等重塑世界。可以预见,应对算力需求和资源约束的主矛盾,系统级和架构级的技术、产品和方案创新必将涌现,也将成为未来数据中心发展的主旋律。 选择方向和路径已成为一种能力和智慧。站在21世纪第三个十年的起点,我们看到ICT产业正面临巨大的发展机会,世界正全面进入数字化和智能化,那么,2030年的世界将是一番怎样的景象?2021年9月份,华为发布了