AI智能总结
Anton Korinek 和 Jai Vipra1 第 228 号工作文件 10 月 2 日nd, 2024 摘要 这篇论文探讨了基础模型市场这一快速增长领域内结构和竞争动态的演变,重点关注大型语言模型(LLMs)。我们描述了塑造该行业并促使领先玩家之间激烈竞争的技术特性。论文分析了基础模型的成本结构。 弗吉尼亚大学和人工智能治理中心。 这是 79 年发表的一篇论文的修订版经济政策4-5日于布鲁塞尔举行的研讨会。我们感谢Susan Athey、Emma Bluemke、Emilio Calvano、Giacomo Calzolari、Claire Dennis、Avi Goldfarb、Doh-Shin Jeon、Aidan Kane、Pia Malaney、Sarah Myers West、Sanjay Patnaik、NicholasRitter、Max Schnidman、Eli Schrag、Rob Seamans和Joseph Stiglitz以及两位匿名评审人提供的宝贵意见和讨论。任何剩余的错误均由我们负责。Korinek衷心感谢Institute for New Economic Thinking(新经济思维研究所)的Center for Innovation, Growth and Society提供的财务支持(资助编号INO21-00004)。Vipra作为Winter Fellow获得了Centre for the Governance of AI的资金支持。本文早期版本曾以《ChatGPT的隐形之手:基础模型对市场集中度的影响》为题进行流通。 强调关键输入的重要性,如计算资源、数据和人才,并指出未来可能形成的显著规模经济和范围经济可能会导致市场集中度增加的趋势。我们探讨了竞争的两个主要担忧:市场倾斜的风险以及垂直整合的影响,并利用我们的分析来制定政策补救措施,以维持竞争格局。 https: / / doi. org / 10.36687 / inetwp228 JEL 代码: D43, O33, L86, L40, L41, K21 关键词 : 人工智能、经济集中度、纵向一体化、人工智能监管。 1. Introduction 在一篇题为“万物的摩尔定律”的文章中,OpenAI首席执行官萨姆·阿尔特曼预测,在接下来的几十年里,人工智能技术将“几乎做到一切,包括做出新的科学发现,从而扩展我们对‘一切’的理解”(阿尔特曼 2021)。一篇由OpenAI研究人员共同撰写的文章估计,大多数职业都可能受到大型语言模型(LLMs)如ChatGPT的部署影响,并且一旦作出配套投资,多达49%的工人可能会有一半或更多的任务暴露在LLMs之下(埃尔东杜等 2024)。如果人工智能模型确实将在我们的经济中扮演如此重要的角色,那么它们提供的市场结构将对社会福利产生直接的影响。因此,包括反垄断机构在内的政策制定者需要密切关注这一话题。 近期的人工智能进步得益于所谓的基础模型的广泛应用——这些大型人工智能模型采用深度学习方法,预先在大量数据上进行训练,然后可以针对特定的经济任务和应用进行微调和适应(Bommasani等,2021)。最显眼的一类基础模型是大型语言模型(LLMs),如OpenAI的GPT-4和Google DeepMind的Gemini,它们能够处理和生成任何主题的文本,并且是生成式人工智能革命的核心。LLMs已经在执行具有经济价值的任务方面展现出了巨大的潜力,通常比人工工人更快、成本更低。它们可以编写计算机代码、查找代码错误、撰写文章、校对文本、总结文件、生成创意、与客户互动等等。此外,已经有证据表明生成式人工智能正在颠覆某些类型的工作(Hui等,2023),一项对美国商业领袖的调查显示,近一半的人已经用ChatGPT取代了员工(Shani,2023)。然而,当前的这一代LLMs显然也存在局限性。 在2024年9月撰写本文时,前沿基础模型市场的动态性和不确定性非常显著,与我们2023年9月首次发布此论文时的情况形成了鲜明对比。当时,我们描述了一个市场,在该市场中,单一模型GPT-4拥有明显的技术优势,其生产商OpenAI因此占据了绝大部分市场份额(Vipra和Korinek,2023)。一年后,根据流行的LMSYS基准测试排行榜,已有14家公司推出了超过原始GPT-4能力的新模型(Chiang等人,2024),并且其中一些模型以开源形式发布,使得全球任何人都可以自由下载和使用。在用户数量和商业化方面,OpenAI仍然处于领先地位,得益于其先发优势。然而,我们注意到技术格局可能迅速变化——例如,如果OpenAI或其他实验室取得重大突破并发布一种展示远超竞争对手能力的基础模型,这种情况就可能发生。 生成人工智能市场的规模在2023年被估计为仅30亿美元(Fernandez等,2023)——这仅仅是10万万亿全球经济中的一小部分。2022年时,甚至还没有提出“生成人工智能”这一术语。然而,市场上涌入的大量参与者表明,许多行为者愿意投身其中。 因为预期未来会有重大的技术进步,并且随之带来巨额的经济回报,他们决定做出显著的投资。这与领先的投资银行和咨询公司的预测一致,这些公司认为该技术可能在未来十年内支撑全球GDP的7%至10%,暗示着巨大的增长潜力(Hatzius等,2023;JP Morgan Research,2024)。在有足够的技术进步的情况下,乐观者相信人工智能的增长效应可能会更高(参见Trammell和Korinek,2023)。从这一角度看,未来的回报可能是天文数字级别的,因此公司有理由竞相行动并保持领先地位。 鉴于基础模型可能在未来经济中扮演如此重要的角色,全球的反垄断机构正密切关注市场的动态(例如,参见Vestager, 2024)。此外,我们在本文中进一步探讨了技术与经济因素提供了强有力的理由,表明应关注人工智能市场中的竞争问题。 然而,为了保持平衡,让我们观察到另一个阵营的观点,他们对人工智能未来经济利益的看法更为悲观。最近,高盛的一份报告题目为“生成式AI:支出过多,收益甚微?”(Goldman Sachs, 2024)。简而言之,这一悲观阵营认为,人工智能不会显著超越现有能力,其经济影响也将非常有限。例如,Acemoglu(2024)估计,生成式AI在未来十年内的增长效应仅为每年0.07%。在这种情况下,市场集中度的影响将只是经济史上的一个附注。目前投资者正试图确定哪种观点更为恰当。 然而,包括OpenAI在内的几家领先的人工智能实验室所声明的使命更为宏伟:未来版本的基础模型将实现人工通用智能(AGI),即具备执行人类能够完成的任何认知任务的能力。如果这一使命得以实现,这些模型将能支撑任何认知工作,并且在配备必要的硬件后,还能执行人类愿意让它完成的任何工作,无论其职业或行业为何。这种关于基础模型未来角色的最激进愿景显然是推测性的,但鉴于近期进展的快速步伐,经济学家和经济政策制定者应将其作为可能的情景加以考虑(Korinek, 2023)。在这种情景下,基础模型市场的范围将是整个经济。此外,人工智能系统市场的结构也可能对权力动态产生重要影响,因为市场集中度的增加很可能会导致控制AGI系统的实体前所未有地积累权力。这种权力将远远超出传统的经济领域,影响全球的社会和政治格局。因此,旨在防止人工智能产业市场过度集中的主动措施可以双重作用:保持经济竞争力并作为防止权力过度集中的关键制衡手段,从而有助于确保这项变革性技术的潜力更好地服务于更广泛的社会利益。 本文余下的部分结构如下。第2节提供了生成式AI当前市场状况的概览,包括主要参与者和反垄断机构的近期关注。第3节分析了基础模型的技术特性和市场结构,探讨了成本结构以及计算资源、数据和人才等关键输入的重要性。第4节深入讨论了市场集中度的相关问题,包括市场倾斜和垂直整合的风险,确保与非AI提供商处于公平竞争环境的重要性,以及应对安全考虑。该节还回顾了欧盟的监管框架。最后,第5节进行总结。 2. 生成 AI 市场的快照 这一部分描述了生成式AI市场中竞争动态和激烈的竞争程度,以及截至撰写时主要玩家的特征。我们首先考察最强大的语言模型(LLMs)之间的能力对比,然后评估这种对比如何影响市场份额的发展演变。 主要球员之间的激烈竞争 表1 列出了截至2024年9月12日可公开获取的顶级大型语言模型的快照,并按LMSYS评分排名,该评分是广泛使用的模型性能基准。LMSYS(Language Model System)是一种基于国际象棋 originally developed for chess 的Elo评级系统的大规模语言模型评级系统(Chiang et al., 2024)。该系统通过让模型彼此竞争来响应真实用户请求,并由人类用户评估哪个模型产生了更高质量的响应来进行评估。模型的分数会不断调整以反映模型相对获胜概率的变化。2 如表格所示,领先的系统在LMSYS评分上非常接近,表明它们在功能上非常相似,并从经济角度看是相互替代的产品。例如,排名前两位的系统——OpenAI的ChatGPT-4o和Google DeepMind的Gemini 1.5 Pro,在LMSYS尺度上的得分仅相差17分,这意味着ChatGPT-4o在单个用户请求中超过Gemini 1.5 Pro的概率约为52%。即使与表格中排名第五的模型Meta的Llama 3.1竞争,ChatGPT-4o获胜的概率也只有57%。其他排名系统,如Hendrycks等人(2020)开发的MMLU基准,该基准衡量大型语言模型在科学主题上的世界知识和解决问题的能力,也显示出顶级模型之间类似群聚的现象。 另一个值得注意的现象是,在该领域激烈的竞争中,表格中的每一款大语言模型(LLM)均在最近三个月内发布或进行了更新。鉴于人工智能领域的快速发展和高度竞争态势,领先的人工智能实验室已经养成了定期发布新版本模型的习惯,以期超越竞争对手。例如,市场领导者OpenAI自2023年3月首次公开GPT-4以来,已经发布了六次模型更新。这些更新显著提高了模型响应的质量(当前LMSYS评分的原始GPT-4得分为1186),将处理速度提高了超过三倍,增加了16倍的文本处理能力,并将生成相同数量输出的成本降低了92%——这一切仅在不到18个月内完成。或许并非巧合的是,OpenAI在其最新更新发布一周后,就在LMSYS排行榜上取代了Google DeepMind的前一版本GPT-4o,迅速重新夺回领先地位。许多观察者指出,领先的AI实验室所收取的价格几乎只能覆盖其变动成本(Knight 2024)——竞争态势似乎接近于伯特兰竞争。3 领先的基础模型 了解主要玩家的背景对于理解他们的动机和策略是有益的。OpenAI 是第一个押注大型语言模型成功的玩家,并且自 2018 年发布 GPT-1 以来一直是该领域的领导者。OpenAI成立于 2015 年,其明确使命是“确保通用人工智能能够惠及全人类”。2019 年,OpenAI成立了一家盈利子公司以吸引资金,以应对不断增长的计算资源成本,这些资源对于训练前沿的人工智能模型至关重要。其主要投资者是微软,微软迄今已向 OpenAI 提供了110 亿美元的资金支持。对盈利子公司的投资结构确保了 非营利组织将在外部投资者收回约定的初始投资倍数后获得所有利润。4这种结构表明,OpenAI 并不仅仅是一个追求利润最大化的企业,尽管它需要产生足够的回报来资助其计算支出。OpenAI 在“服务人类”与创造利润之间的张力体现在多个方面,包括其在2023年11月经历的董事会戏剧性事件。许多观察者预计,OpenAI 将很快发布一款具有显著超越当前竞争对手能力的新模型。 市场上的第二大玩家是Google DeepMind,隶属于Google母公司Alphabet。Google DeepMind是由Google内部前沿人工智能部门Google Brai