300 字的概要 本次访谈中,英伟达(Nvidia)创始人兼首席执行官黄仁勋回顾了公司从 1993 年创立的初衷——通过加速计算解决通用计算的局限性,并同时发明了 GPU 技术和市场。他详细阐述了 CUDA 如何使 GPU 通用化,并成为推动深度学习和 AI 革命的基础设施。黄仁勋强调了“AI工厂”这一整体平台概念,该平台通过垂直整合和快速迭代,突破了摩尔定律的限制,实现了极高的能源效率和性能。展望未来,他认为 AI 将变革企业劳动力(代理式 AI)和物理世界(机器人技术/Omniverse),这两个市场潜力巨大。此外,他还讨论了主权 AI 的必要性以及 AI 安全将演变为类似网络安全的社区模式。黄仁勋认为未来的计算范式将是生成式的,需要每年数万亿美元的基础设施投资。 Constantine Buer 大家早上好。我叫 Constantine Buer,是红杉资本(Sequoia Capital)的合伙人,专注于 AI 投资。英伟达和 Citadel Securities 实际上有很多共同点。它们都是杰出的企业,运营良好,拥有非常杰出的领导者。它们都由计算革命推动,并且都是各自行业的技术领导者。它们还有一个鲜为人知的共同点:两者的第一个外部投资者都是红杉资本。我们曾在 1993 年向英伟达投资了 100 万美元,你值这个价。 当被邀请在这次会议上谈论 AI 时,我们很清楚,世界上最适合发言的人就是他——这位为整个人工智能革命建立了基础设施,并在此基础上奠定了一切的男士,同时他也是世界上最有价值公司的缔造者。请大家和我一起欢迎黄仁勋。 Jensen Huang 谢谢,很高兴以这种方式醒来。 Constantine Buer 你已经工作了好几个小时了。是的,我知道。 那么,黄仁勋,我们的会议室里坐满了世界上一些最优秀的机构投资者,他们管理着数万亿美元的资产,并且不断寻找优势。你总能拥有这种优势,在我们每一次的谈话中,你都能对未来的发展提供引人注目的见解。在接下来的 60 分钟里,我们有一个雄心勃勃的议程:从英伟达成立之初的故事,一直到它崛起成为 AI 革命的中心,然后我们将把大部分时间花在英伟达和 AI 的下一步发展上。 好的,让我们从最初开始。那是 1993 年,你 30 岁。是什么样的洞察力让你下定决心创立英伟达,并获得了优势? Jensen Huang 当时我们正在经历个人电脑(PC)革命和中央处理器(CPU)革命。那是摩尔定律的时代,是集成微处理器、英特尔、晶体管缩放定律备受关注的时期。硅谷几乎所有的投资都集中在计算机行业的这一领域。 我们观察到了一些不同的东西。我们认为,虽然 CPU 的一个优势是它的通用性,但通用技术的根本问题是它们往往无法非常出色地解决非常困难的问题。因此,我们提出了两个猜想。首先,我们观察到有一些问题可以通过加速器来解决,这种加速器更具领域特异性、更具针对性,而解决这些问题可能会很有趣。其次,我们观察到通用技术中晶体管的缩小最终会达到极限。 Jensen Huang 继续缩小晶体管尺寸并使用这种技术进行扩展的想法,它基于一套启发式方法,被称为丹纳德缩放(Dinard scaling)。丹纳德和康威提出了摩尔定律背后的基本原则,如果你回顾这些原则,你会发现晶体管可以缩小到多远是有限制的,总有一天你会遇到回报递减。我们相信我们可以解决的计算问题在规模上几乎是无限的。 因此,总有一天,一种新型的计算方法将会出现。我们的公司专注于用加速计算这项技术来增强和补充通用计算。这真的是我们的洞察。你之前提到英伟达总是走在时代的前面。很多时候,如果你从第一性原理来推理论证,问自己一个问题:现在运行得非常好的是什么?这个第一性原理是建立在什么基础之上的?以及它将如何随时间变化?这将让你有望预见到未来的发展。 Constantine Buer 所以当你构建图形加速器时,你算是先行者,但随后涌现了数百家竞争对手。你最终赢得了那个市场。但在 21 世纪初,你说:“嘿,这项技术也许能够通用化。”你谈论的是 CPU 的通用化,也许 GPU 也可以通用化以进行更多处理。我们来谈谈 CUDA 是如何产生的?你从哪里得到这个洞察力的?据说它来自于研究人员,你是如何解读他们的工作并得出 GPU可以成为通用计算设备的结论的? Jensen Huang 首先,英伟达之所以难以创建,是因为我们必须发明一项新技术并同时创造一个市场。在1993 年,为了创建一个新的计算平台,你需要一个庞大的市场。当时做 3D 图形的硅谷图形公司(Silicon Graphics)的市场太小,无法支撑一个新的计算平台。 因此,如果我们要创造一个新的计算架构,我们需要一个新且庞大的市场,但由于架构尚未存在,所以这个大市场也不存在。你就陷入了“先有鸡还是先有蛋”的困境。英伟达擅长的事情之一就是现代 3D 图形和视频游戏市场,我们为此做出了巨大贡献。当时红杉资本对英伟达的融资原则最大的担忧是,我们必须同时发明技术和市场,而成功的几率约为 0%。 Jensen Huang 我仍然记得当我推销这个故事时,唐·瓦伦丁(Don Valentine)问:“黄仁勋,你的应用在哪里?你的杀手级应用是什么?”我说:“哦,有一家叫做艺电(Electronic Arts)的公司。”我当时不知道唐刚刚投资了艺电。我说:“艺电将会创造,我们将帮助他们创造 3D 图形游戏,我们将创造这个市场。”他说:“黄仁勋,我想让你知道,我们投资了艺电,他们的首席技术官才 14 岁,是被人开车送去上班的,你却告诉我这是你的杀手级应用?” 无论如何,我们创造了现代 3D 图形游戏生态系统,正如你所知,它是世界上最大的娱乐产业之一。3D 图形的根本问题基本上是模拟现实。如果你回到第一性原理,它所做的就是 试图重现现实。再现照片级真实感图像和动态世界的数学基础,从根本上说是物理模拟。因此,线性代数显然非常重要。 Jensen Huang 我们意识到这个概念。所以问题是,如何将一个通用目的的东西带入一个非常专业的领域?这就是我们公司最伟大的发明。我们发明了技术,发明了市场,并且发明了使我们能够系统性地从一个垂直聚焦的行业,最终变得越来越通用的途径。 这种情况几乎从未发生过,这条道路非常艰难,但我不想花时间解释它。我认为 CUDA 的发明既是技术发明的一部分——即观察我们如何能够泛化我们的 GPU,但其中很大一部分是关于新产品的发明、如何将其推向市场、新策略的发明(如何让市场接受),以及发明最终形成飞轮的生态系统,从而使计算平台得以实现。我们发明了所有这些东西,它们都是全新的。 Jensen Huang 如果你退一步问自己:除了 ARM 和 x86 之外,世界上还存在哪一个几乎所有人都使用的计算平台?答案是不存在。发明一个新的计算平台非常罕见,在我们的案例中,这花了我们近 30 年的时间。 Constantine Buer 所以你能够将这种非常专业、性能极高的加速设备通用化,让世界各地的研究人员和学者能够更快地运行他们的处理任务。他们一直面临的摩尔定律限制,突然之间得到了极大的缓解。现在让我们快进到 21 世纪 10 年代初。那时,深度学习还处于学术上的低谷期。神经网络的想法经历了一个寒冬。接着在 2012 年,AlexNet 在计算机视觉方面取得了突破,所有这些都是在英伟达 GPU 上加速完成的。那一刻你是否意识到这场 AI 革命正在成为现实?如果是,你是如何利用它使英伟达成为这场革命的中心的? Jensen Huang 有两次意外的巧合,以及一次基于第一性原理对深度学习的伟大观察。 巧合始于当时我试图解决计算机视觉问题。我们想解决计算机视觉有很多原因,但总之我们想要解决它。然而,计算机视觉非常脆弱,很难推广,它只是大量技巧的集合。我非常讨厌这个行业的发展方式,对进展感到相当沮丧。 Jensen Huang 与此同时,我们普及架构的一项主要策略是争取让高等教育的科学家使用我们的平台,使用CUDA。我从地震处理、分子动力学、粒子物理学、量子化学开始,把英伟达 CUDA 带到了各个地方。事实上,公司当时有一个策略叫做“CUDA Everywhere”(CUDA 无处不在),意思是黄仁勋要把 CUDA 推广到全世界。 我去了世界各地的大学,会见了研究人员。这项将 CUDA 引入高等教育和研究人员的倡议,促使一些研究人员在 2011 年、2012 年联系我们。杰夫·辛顿(Jeff Hinton)当时正在尝试解决计算机视觉问题,吴恩达(Andrew Ng)和杨立昆(Yann LeCun)也都在尝试解决计算机视觉问题,因为当时有一个由李飞飞负责的 ImageNet 竞赛即将到来,而我也在尝试解决计算机视觉问题。所以当你自然地尝试解决一个问题时,所有这些有趣的人都在解决类似的问题,这自然会吸引你的注意力,这就是巧合。 Jensen Huang 另一个伟大的观察是,我们可以为他们创造一种新型求解器,叫做 cuDNN。它有点像存储计算中的 SQL。我们发明了 cuDNN,你可以把它看作是网络计算。这种进行计算的方式——这个名为 cuDNN 的库——使得他们所有人都能成功地使用 CUDA。 但我们做得更进一步,我们看到了和大家一样的结果——计算机视觉的有效性有了巨大的飞跃,但我们对“为什么它在计算机视觉方面如此出色?它还能擅长什么?”进行了推理论证。 深度神经网络具有极深的潜力,因为每一层都可以独立于其他层进行训练,并且你可以从损失函数向后传播到其输入端,这使得它能够学习几乎任何函数。 JensenHuang 我们得出的结论是:这是一个通用函数逼近器(universalfunctionapproximator)。如果我们可以向其中添加状态(例如CNN是一种二维/多维的模式识别器,然后RNN提供了状态机,LSTM提供了更好的状态机,而Transformer提供了终极状态机),那么我们就有了一个可以学习几乎任何功能的通用函数逼近器。现在问题来了:它可以解决什么问题? 我们反转了问题,得出的结论是,我们想要解决的大多数问题都可以包含深度学习的成分。因此,我们决定:我们应该如何推断深度学习在未来10年、20年会发展到哪里?我们分解了计算问题,得出结论,每一块芯片、每一个系统、每一款软件、计算堆栈的每一层都可以被重新发明。这个决定可能是历史上最好的决定之一。 ConstantineBuer 我当时在斯坦福大学做AI研究,主要的限制一直是计算能力。我们有限的集群才能运行这些算法。英伟达的介入不仅缓解了这种计算限制,而且通过CUDA基础设施使其成为可能。这在很大程度上是你的历史:让更多的计算成为可能。在2016年,你非常出名地创造了世界上第一个AI工厂DGX-1。你实际上是亲自把它送到了伊隆·马斯克在OpenAI的办公室。 JensenHuang 是的,我建造了这台全新的计算机,它看起来与世界上任何见过的东西都不一样,它的工作方式也与世界上任何见过的东西都不一样。我记得在GTC大会上宣布它时,听众的反应就像现在这样:没有人知道我在说什么。这只是一个玩笑,掌声也是一样稀少。 所以我宣布了这东西,每个人都“嗯,知道了”。就在那次GTC上,我邀请伊隆来谈论自动驾驶,我们俩当时正在合作研究自动驾驶汽车。他上台问:“黄仁勋,那是什么电脑?”我说:“DGX-1,我就是为此目的制造的。”他说:“我可以用一台。”我终于拿到了一份采购订单。然后他说:“我有一个非营利组织。”我当时想:“当你建造全新的东西时,你最不想听到的就是你的第一个客户是非营利组织。” JensenHuang 无论如何,我送货上门了。我成了DoorDash电脑配送员,我把这台电脑“DoorDash”到了旧金山。这家公司就是OpenAI。它现在是一个非常赚钱的非营利组织,或者说是一个营收规模很大的非营利组织。 我们合作了很长时间。从那时起,每一个模型都是在英伟达的设备上构建的。