新领域:维持 美国在Exascale时代的高性能计算领导地位 斯蒂芬·埃泽尔|2022年9月 随着高性能计算(HPC)进入百亿亿次时代,其在高性能计算(HPC)领域的持续领先地位仍然是美国工业竞争力 、经济实力和国家安全准备就绪的关键支柱。政策制定者需要维持对HPC应用、基础设施和技能的投资,以保持美国处于领先地位。 关键要点 ▪HPC代表了一项重要的国家战略能力,全球HPC领导地位取决于保持在HPC系统开发及其应用和使用的前沿。 ▪百亿亿次超级计算的出现为来自各个领域的研究人员打开了大门,让他们能够以迄今为止几乎无法想象的分辨率、细节、保真度和信心的规模和水平探索物理现象。 ▪HPC能力对于工业竞争力越来越重要,它支撑着从航空航天和生物技术到消费品和清洁能源等一系列领域的研发(R&D)和创新。 ▪鉴于超级计算对各国经济和国家安全的重要性,许多国家和地区都在激烈竞争超级计算的领导地位。 ▪2015年,美国拥有的世界500强超级计算机数量几乎是中国的两倍。但中国改变了剧本,现在报告了173个(甚至可能被低估了),而美国则为128个。 ▪为了使美国保持领先地位,政策制定者必须利用CHIPS和科学法案中与HPC相关的资金和计划,扩展其STEM(科学、技术、工程和数学)管道,并使HPC计算资源的访问民主化。 itif.org 内容 要点1 简介3 什么是高性能计算?3 为什么高性能计算很重要?6 开启科学技术发现的新途径6HPC代表高级计算8中的“矛尖” 最大限度地发挥AI/ML/DL9的潜力超级计算的经济影响10 为什么国家在HPC方面的领导地位很重要?12 国际超级计算领导力13 HPC16的下一代商业应用 HPC助力航空航天创新16 HPC支持汽车创新和移动解决方案20 HPC助力消费品创新21 HPC助力美国生命科学创新22 清洁能源创新27 HPC29的防御和面向环境的应用 政策建议32 结论34 尾注35 介绍 高性能计算(HPC)是指超级计算机,通过结合处理能力和存储容量,可以快速解决跨科学、工程和商业领域的 各种困难计算问题。1HPC代表着一种战略性的、改变游戏规则的具有巨大经济竞争力、科学领导地位和国家安全影响的技术。由于HPC站在科学发现和商业创新的最前沿,因此它处于竞争的前沿——对于国家及其企业来说都是如此——这使得美国在生产和采用HPC方面的实力有助于其工业竞争力和国家安全能力。 2022年5月30日,随着边境,能源部(DOE)橡树岭国家实验室(ORNL)的一台超级计算机,能够每秒执行一个quintillion浮点运算(FLOPS)。百亿亿次计算的出现将为科学家们刚刚开始探索的各种科学、技术和工程领域带来迄今为止难以想象的大量研究机会。然而,虽然百亿亿次计算无疑代表了游戏规则的改变者,但更多功能越来越强大的超级计算机的扩散正在帮助航空航天、天文学、生物学、粒子物理学、地震学和天气等领域的研究人员在建模方面取得突破对复杂的生物、化学和物理系统进行模拟(M&S),加深对科学的理解并释放新的创新。对于美国工业而言,HPC应用的领先地位对于研究和产品开发、上市时间、成本规避和在制造过程中实现能源效率是不可或缺的,使HPC设施成为实现比较优势和以差异化和独特的方式进入市场的关键机制有价值的建议。简而言之,从经济和国家安全的角度来看,HPC代表了一项关键能力,政策制定者必须继续维持投资并建立生态系统,以确保美国在这项关键技术方面处于世界领先地位。 本报告首先解释了什么是HPC,并研究了HPC本身和国家领导地位为何如此重要。然后,它评估全球HPC领导地位,然后转向探索工业、国家安全和面向任务的领域的一系列尖端HPC应用程序。最后,它提供了政策建议,以确保美国在开发HPC系统和应用程序方面仍然处于世界领先地位。 什么是高性能计算? HPC是指应用超级计算机(世界上最快、最大、最强大的计算机系统)以及复杂的模型和大型数据集来研究和解 决复杂的科学、工程和技术挑战,尤其是那些需要理解、建模和模拟复杂的、多变量的物理系统。2HPC将多种技术(包括计算机体系结构、程序和电子设备、算法和应用软件)结合在一个平台下,以快速有效地解决高级、有时是迄今为止难以解决的问题。 世界领先的超级计算机以它们可以计算的FLOPS数量来衡量,并且它们的容量在过去30年中大幅增加。1993年 ,世界上最快的计算机能够执行1240亿次,即超过109FLOPS,也称为“gigaflops”。世界上最快的超级计算机的速度在随后的时间里稳步提升 1997年突破了teraflop门槛,即1012FLOPS,2008年突破了petaflop门槛,即1015FLOPS。(见图1。)十四年后,随着边境2022年5月30日在ORNL的超级计算机上,美国成为第一个公开部署百亿亿次超级计算机的国家(中国可能在2021年有两台超级计算机跨越了这一门槛,尽管这些没有正式提交到500强名单中), 一个能够每秒执行1018或1quintillion(即100万万亿)FLOPS(即“exaflop”)3(见图2。) 2022:1exaflop 0 00 2008:1petaflop 000 1997:1teraflop 00 ,000 1,000 1 图1:世界上最快的超级计算机的速度,1993-20224 1,000,000,000,000,000,00 1,000,000,000,000,0 1,000,000,000, 1,000,000,0 1,000 每秒浮点运算次数 (FLOPS),以1,000 为底的对数刻度 边境870万核心,额定速度1.102exaflops,超越日本当时世界领先的超级计算机超级计算机深谷(日语为富士山 ),拥有760万个内核,额定值为537petaflops.5(一个内核通常是指一个独立的执行单元,可以同时获取指令并一 一执行。)边境占地超过4,000平方英尺,包括90英里的电缆和74个机柜,每个机柜重8,000磅。6极光, 2022年晚些时候在阿贡国家实验室上线,性能水平可能超过两个exaflops。72023年,美国将上线第三台具有exascale能力的计算机,埃尔卡皮坦,预计将在劳伦斯利弗莫尔国家实验室(LLNL)以1.5exaflops运行,其首要任务是帮助管理国家的核武库。8 图2:边境超级计算机,橡树岭国家实验室9 理解计算机处理速度的每一步变化(从gigaflops到teraflops到petaflops到exaflops)代表着峰值计算速度增加1,000倍:也就是说,增加了三个“数量级”(一个“数量级”),这一点至关重要。量级”通常被理解为某物增加了10倍)。因此,Exascale超级计算机比Petascale计算机快1,000倍,功能更强大。(见图3。)总而言之,世界上最快的超级计算机的性能在过去20年中提高了近70,000倍。10 图3:概念化超级计算机处理速度的增长11 1015 一万亿翻牌 问 1018 一 曲英蒂利n 翻牌 109 一十亿翻牌 1012 一 兆 翻牌 1,000,000,000,000,000,000 1,000,000,000,000,000 1,000,000,000,000 1,000,000,000 每秒浮点运算次数 (FLOPS),以1,000 为底的对数刻度 1,000,000 1,000 1 千兆翻牌 万亿次浮点运算 Petaflop 翻牌圈 为什么高性能计算很重要? 从概念上讲,HPC对国家的经济和国家安全非常重要,原因有几个,包括1)为科学和技术发现开辟了新的途径 和途径;2)代表更强大的计算架构和技术的“长矛”,最终使一个人的笔记本电脑、平板电脑或智能手机更有能力;3)将成为释放大数据和人工智能/机器学习/深度学习(AI/ML/DL)的巨大潜力以促进发现和创新的重要推动力;4)直接和间接产生显着的经济效益。虽然以下部分的框架是关于现在已经实现百亿亿次计算时代的潜在新机遇,但必须注意的是,目前仍然只有一台百亿亿级超级计算机,因此以下讨论的所有好处都广泛适用于HPC ,无论超级计算机在petaflop还是exaflop范围内运行。 在过去的20年里,世界上最快的超级计算机的性能提高了近70,000倍。 开启科技发现的新途径 如前所述,具有百亿亿次计算能力的计算机将比仅具有千万亿次计算能力的计算机快1,000倍且功能更强大。这 很重要,因为正如荷兰计算机科学家EdsgerDijkstra所解释的那样,“如果数量差异大于一个数量级,那么数量差异也是质的差异。”12因此,实现百亿亿级超级计算机的一个关键原因重要的是,计算能力每增加一个数量级 ,人们就可以在使用该计算能力时获得质的提升。换言之,可在百亿亿级平台上运行的应用程序类型与可在百亿亿级平台上运行的应用程序类型根本不同。13每秒一万亿次操作,百亿亿级计算机将能够“更真实地模拟所涉及的过程在精准医学、微气候、增材制造、原子的晶体结构、人体细胞和器官的功能,甚至宇宙的基本力量等科学发现和国家安全方面。”14 正如GEResearch高级计算方法研究高级主管RickArthur所说: 研究人员只能模拟一个适合他们可以访问的最大计算机大小的宇宙。因此,顶级“领导阶层”计算机设定了哪些现象可以被感知、研究和理解的门槛。也就是说,如果感兴趣的主题的数据或模型超过了您计算机上可以存储或可行处理的数据或模型,那么您将无法获得洞察力。Exascale计算机系统极大地扩展了科学家和工程师可以建模的领域,因此它们可以在基于物理和数据衍生的模型中实现前所未有的真实性;在规模和范围方面具有更高的完整性、准确性和保真度,并且能够更自信地评估来自输入和输出置信边界的敏感性。15 换句话说,百亿亿次时代的计算将为解决复杂、多变量的科学、技术和工程挑战打开新的大门,尤其是那些需要数据密集型、M&S驱动的解决方案的挑战,从而可以在分辨率水平上理解这种现象, 粒度和细节前所未有。超级计算机(一般而言,尤其是百亿亿次计算)将能够构建更高保真度的多物理场模型 ,该模型可以在数学上描述系统内不同物理现象和变量的实时相互作用,促进复杂相互作用的模拟和隔离的潜力影响系统的每个变量的相对影响。16虽然这不是一个精确的类比,但以1018的速度计算将使科学家能够 以更高的10倍分辨率、维度或时间段(在每种情况下,按比例缩放)研究复杂的物理系统无论是在原子爆炸 瞬间模拟90亿个单个原子的行为,还是对跳动的人类心脏中每个细胞的动作,以及通过智能电网的电流运动 ,都以更快的速度进行建模,或原子或分子的晶体结构。 正如Arthur解释的那样,“像HPC这样的计算工具从根本上代表了一种科学仪器”,就像显微镜(它允许人们对系统进行极其详细的询问)或宏观显微镜(如望远镜,它允许研究人员感知系统范围内的相互作用并探索17科学家在广泛的物理尺度(即不同的大小或长度)、时间尺度和空间尺度(例如,现象发生的时代或地区的范围 )研究物理现象和系统.这非常重要,因为与大尺度(例如宏观尺度)相比,物理现象的行为在非常不同的尺度 (例如纳米尺度)上可能具有不同的动力学。 超级计算机可以以比其他计算机高数万到数十万倍的分辨率(即细节级别)对系统中的行为进行建模。例如,了解纳米级物理——例如流体穿过膜孔的行为——需要对长度为100纳米(nm)或更短的相互作用进行建模。相反,要在宏观尺度(肉眼可见)研究这种相互作用的影响,需要将相互作用缩放四个数量级,或10,000倍,达到1,000,000nm,或大约一粒沙子的大小。18(参见图4。) 图4:按数量级概念化尺度长度19 正如美国能源部能源效率和可再生能源办公室(EERE)的一份报告所解释的那样,这对美国工业竞争力很重要的一个特殊原因是,在制造业中,“已经取得了更容易实现的进步;20换句话说,改变游戏规则或创造竞争优势的产业创新机会将越来越需要企业去实现HPC独特定位的“高悬果实”。以方便。正如报告