一个新边疆:维持 百万兆次级时代的美国高性能计算领导地位 斯蒂芬。这时警报声响起|2022年9月 随着高性能计算(HPC)进入百万兆次级时代,它仍然是美国工业竞争力、经济实力和国家安全准备的关键支柱 。政策制定者需要持续对HPC应用程序、基础设施和技能的投资,以保持美国的领先地位。 关键的外卖 ▪HPC代表着一种重要的国家战略能力,而全球HPC的领导地位取决于在HPC系统开发及其应用和使用方面保持领先地位。 ▪百万兆次级超级计算的出现为来自各个领域的研究人员打开了大门,以迄今为止几乎无法想象的规模和水平探索物理现象,其分辨率、细节、保真度和信心。 ▪HPC的能力对工业竞争力越来越重要,支撑着从航空航天和生物技术到消费品和清洁能源等一系列领域的研发(R&D)和创新。 ▪鉴于超级计算对各国经济和国家安全的至关重要性,许多国家和地区正在激烈争夺超级计算的领导地位 。 ▪2015年,美国拥有的世界500强超级计算机数量几乎是中国的两倍。但中国已经翻转了剧本,现在报告了173个(甚至可能被低估了),而美国则为128个。 ▪为了保持美国的领先地位,政策制定者必须利用《芯片和科学法案》中与HPC相关的资金和计划,扩大其STEM(科学,技术,工程和数学)管道,并使HPC计算资源的访问民主化。 itif.org 内容 线索1 介绍3 高性能计算是什么?3. 高性能计算为什么重要?6开启科技发现新途径6 HPC代表了高级计算8中的“矛尖”最大化的潜力AI/ML/dl9 经济影响的超级计算10 为什么国家领导人在HPC重要吗?12国际超级计算机领导13 下一代商业应用的hpc16HPC使航天创新16 HPC支持汽车创新和移动解决方案20 HPC助力包装消费品创新21HPC使美国生命科学创新22清洁能源创新27 HPC29的面向国防和环境的应用政策建议32 结论34尾注35 介绍 高性能计算(HPC)是指通过处理能力和存储容量的组合,可以快速解决各种科学、工程和商业领域的困难计 算问题的超级计算机.1HPC代表了一种改变游戏规则的战略技术,具有巨大的经济竞争力、科学领先地位和国家安全影响。由于HPC站在科学发现和商业创新的最前沿,因此它处于竞争的前沿-对于国家及其企业来说-这使得美国在生产和采用HPC方面的优势有助于其工业竞争力和国家安全能力。 2022年5月30日,全球进入百万兆次级计算时代,推出前沿,能源部(DOE)橡树岭国家实验室(ORNL)的超级计算机,每秒能够执行一万亿次浮点运算(FLOPS)。百万兆次级计算的出现将开启各种科学、技术和工程领域的大量迄今为止几乎无法想象的研究机会,科学家们甚至才刚刚开始探索这些机会。然而,虽然百万兆次级计算无疑代表了游戏规则的改变者,但更多功能越来越强大的超级计算机的扩散正在帮助航空航天、天文学 、生物学、粒子物理学、地震学和天气等领域的研究人员在复杂生物、化学和物理系统的建模和模拟(M&S)方面取得突破,加深科学理解并释放新的创新。对于美国工业来说,HPC应用的领导地位是研究和产品开发、上市时间、成本规避和制造过程中实现能源效率不可或缺的一部分,使HPC设施成为实现比较优势并以差异化和独特价值主张进入市场的关键机制。简而言之,从经济和国家安全的角度来看,HPC都代表着一种关键能力,政策制定者必须继续维持投资并建立生态系统,以确保美国在这一关键技术方面处于世界领先地位。 本报告首先解释了什么是HPC,并研究了为什么HPC本身和国家领导地位很重要。然后,它评估了全球HPC领导地位的状态,然后转向探索工业、国家安全和面向任务领域的一系列尖端HPC应用。最后,它提供了政策建议,以确保美国在开发HPC系统和应用程序方面保持世界领先地位。 高性能计算是什么? HPC是指超级计算机(世界上最快、最大、功能最强大的计算机系统)的应用,以及复杂的模型和大型数据集, 以研究和解决复杂的科学、工程和技术挑战,尤其是那些需要理解、建模和模拟复杂、多变量物理系统的挑战。HPC结合了多种技术,包括计算机体系结构、程序和电子、算法和应用软件,在单一平台下快速有效地解决先进的,有时甚至是迄今为止棘手的问题。 世界领先的超级计算机是通过它们可以计算的FLOPS数量来衡量的,并且它们的容量在过去30年中大大增加。1993年,世界上最快的计算机能够执行1240亿次,或超过109次FLOPS,也称为“gigaflops”。在随后的时间里,世界上最快的超级计算机的速度稳步提高 几十年,在1997年跨越了teraflop阈值,即1012FLOPS,在2008年跨越了petaflop障碍,或1015FLOPS。(请参阅图1。十四年后,随着前沿超级计算机在ORNL上,美国成为第一个公开部署百万兆次级超级计算机的国家 (中国可能在2021年有两台超级计算机越过了这个门槛,尽管它们没有正式提交到500强名单),一台能够执行1018或一万亿次(即100万亿亿),每秒FLOPS(即一个“exaflop”).3(见图2。 2022:1exaflop 0 00 2008:1数学运算 000 1997:1teraflop 00 ,000 1,000 1 图1:世界上最快的超级计算机的速度,1993-20224 1,000,000,000,000,000,00 1,000,000,000,000,0 1,000,000,000, 1,000,000,0 1,000 每秒浮点运算数(FLOPS),以1,000对数刻度为基数 前沿,拥有870万个内核和1.102exaflops的额定速度,超过了日本当时世界领先的超级计算机超级计算机 Fukagu(日语为富士山),具有760万个内核,额定值为537petaflops.5(内核通常是指单个独立的执行单元,可 以获取指令并同时逐个执行。前沿占地超过4,000平方英尺,包括90英里的电缆和74个机柜,每个机柜重8 ,000磅.6美国计划带来第二台具有百万兆次级功能的计算机,极光,2022年晚些时候在阿贡国家实验室上线 ,性能水平可能超过2exaflops.72023年,美国将上线第三台具有百万兆次级功能的计算机,埃尔卡皮坦,预计将在劳伦斯利弗莫尔国家实验室(LLNL)以1.5exaflops的速度运行,其首要任务是帮助管理国家的核武库8 。 图2:前沿超级计算机,橡树岭国家Laboratory9 重要的是要明白,计算机处理速度的每一步变化——从gigaflops到teraflops到petaflops到exaflops——都代表着峰值计算速度的1000倍提高:也就是说,三个“数量级”的增加(一个“数量级”通常被理解为某物增加了10倍) 。因此,百万兆次级超级计算机比千万亿次级计算机快1,000倍,功能强大。(请参阅图3。总而言之,世界上最快的超级计算机的性能在过去20年中提高了近70,000倍。 图3:概念化超级计算机处理速度的增长11 1015 一个 问uadrillion 失败 1018 一个 曲intillion 失败 109 一个欧 元失败 1012 一个 亿 失败 1,000,000,000,000,000,000 1,000,000,000,000,000 1,000,000,000,000 1,000,000,000 每秒浮点运算数(FLOPS),以1,000对数刻度为基数 1,000,000 1,000 1 速度Teraflop 数学运算 Exaflop 高性能计算为什么重要? 从概念上讲,HPC对国家的经济和国家安全至关重要,有几个关键原因,包括1)为科学和技术发现开辟了新的 途径和途径;2)代表更有能力的计算架构和技术的“矛”,最终使一个人的笔记本电脑,平板电脑或智能手机更有能力;3)将成为释放大数据和人工智能/机器学习/深度学习(AI/ML/DL)的巨大前景以促进发现和创新的重要推动力;4)直接或间接产生显著的经济效益。虽然以下部分是关于百万兆次级计算已经实现的潜在新机会的框架,但必须注意的是,目前只剩下一台百万兆次级超级计算机,因此以下所有讨论的好处都广泛适用于HPC,无论超级计算机在petaflop还是exaflop范围内运行。 在过去的20年里,世界上最快的超级计算机的性能提高了近70,000倍。 开启科技发现的新途径 如前所述,具有百万兆次级的计算机将比仅具有petascale功能的计算机快1,000倍,功能更强大。这很重要 ,因为正如荷兰计算机科学家EdsgerDijkstra所解释的那样,“如果数量差异大于一个数量级,那么数量差异也是质的差异。12因此,实现具有百万兆次级能力的超级计算机之所以重要的一个关键原因是,计算能力每提高一个数量级,人们就会享受到用这种计算能力所能实现的目标的质量增加。换句话说,可以在百万兆次级平台上运行的应用程序类型与可以在千万亿次级平台上运行的应用程序类型根本不同.13以每秒一万亿次运算的速度,百万兆次级计算机将能够“更真实地模拟科学发现和国家安全所涉及的过程,如精准医学、微气候、增材制造,原子的晶体结构,人体细胞和器官的功能,甚至宇宙的基本力。14 正如GEResearch高级计算方法研究高级主管RickArthur所描述的那样: 研究人员只能模拟一个适合他们可以访问的最大计算机大小的宇宙。因此,顶级“领导类”计算机为可以感知、研究和理解哪些现象设定了阈值。也就是说,如果感兴趣的主题的数据或模型超过了计算机上可以存储或可行处理的数据或模型,则洞察力超出了您的范围。百万兆次级计算机系统极大地扩展了科学家和工程师可以建模的范围,因此它们可以在基于物理和数据衍生的模型中实现前所未有的真实感;在规模和范围方面具有更高的完整性、准确性和保真度,并且能够更自信地评估输入的灵敏度和输出的置信度边界15 。 换句话说,百万兆次级时代的计算将为解决复杂的、多变量的科学、技术和工程挑战打开新的大门,特别是那些需要数据密集型、M&S驱动解决方案的挑战,从而在分辨率水平上理解这种现象。 前所未有的粒度和细节。超级计算机(一般而言,尤其是百万兆次级)将能够构建更高保真度的多物理场模型 ,这些模型可以在数学上描述系统内各种物理现象和变量的实时相互作用,从而促进复杂相互作用的模拟,并有可能隔离影响系统的每个变量的相对效应.16虽然这不是一个精确的类比,以1018的速度计算将使科学家能够以更高的10倍分辨率、维度或时间段(在每种情况下,放大或缩小)和更快的速度研究复杂的物理系统 ,无论是在原子爆炸的瞬间模拟90亿个单个原子的行为,跳动的人心中每个细胞的作用,通过智能电网的电力运动,或原子或分子的晶体结构。 正如Arthur所解释的那样,“像HPC这样的计算工具从根本上代表了一种科学仪器”,就像显微镜(它允许人们极其详细地询问系统)或宏观望远镜(如望远镜,它允许研究人员感知系统范围的相互作用并探索广阔的维度) 。17科学家研究各种物理尺度(即不同大小或长度)、时间尺度和空间尺度(例如,现象发生的时代或区域的范围)的物理现象和系统。这非常重要,因为与大尺度(例如宏观尺度)相比,物理现象的行为可以在非常不同的尺度(例如纳米尺度)上具有不同的动力学。 超级计算机可以以比其他计算机高数万到数十万倍的分辨率(即细节水平)对系统中的行为进行建模。例如,理解纳米级物理学(例如流体穿过膜孔的行为)涉及模拟长度为100纳米(nm)或更短的相互作用。相反,要在宏观尺度(肉眼可见)上研究这种相互作用的影响,需要将相互作用放大四个数量级,即10,000倍,达到1 ,000,000纳米,或大约一粒沙子的大小.18(见图4)。 图4:按数量级概念化刻度长度19 正如美国能源部能源效率和可再生能源办公室(EERE)的一份报告所解释的那样,这对美国工业竞争力很重要的一个特殊原因是,在制造业中,“已经取得了更容易实现的进步;所谓的'唾手可得的果实'已经被摘掉了。20换句话说,改变游戏规则或创造竞争优势的工业创新的机会将越来越多