AI智能总结
新兴技术研究《新兴科技未来报告:更新我们 PitchBook Data, Inc. 对生成式AI的展望》 塔赫尼,尼扎尔执行副总裁,研究与市场情报 保罗·康德拉新兴技术研究领域负责人 机构研究组 分析 新兴技术研究团队 模型蓬勃发展,而复杂性和成本影响应用 Brendan Burke;Robert Le;Derek Hernandez;Rudy Yang;Eric Bellomo;Alex Frederick;John MacDonagh;Ali Javaheri;Jonathan Geurkink;Kazi Helal,博士;Aaron DeGagne,CFA;Rebecca Springer,博士 PitchBook是Morningstar公司,为在私募市场从事业务的专业人士提供最全面、最准确和难以找到的数据。 pbinstitutionalresearch@pitchbook.com 出版 设计由 ... 承担珍妮·奥马利 引言 发布于2024年9月30日 目录 2023年5月,我们的团队已发布的观点关于如何生成式人工智能(GenAI)即将影响各个行业和技术的研究。本报告重新审视了这些观点,并提出了关于GenAI如何(或如何不)体现出来,以及预期如何改变或演变的全新见解。 2023年初ChatGPT的兴起是一个转折点,标志着人工智能被理解为一种易于适应的技术,具有广泛的应用潜力。自那时以来,相关技术和初创公司的投资激增,这一点在基础模型领域的激烈竞争中表现得尤为明显,新创业公司和现有技术公司都积极加入了这场角逐。 人工智能基础设施领域正在根据几个用例分层,例如设备端推理、特定领域知识以及提供强大的原始计算能力以实现最快的结果。一些形态,如通用消费者搜索和聊天机器人,已成为像谷歌和Meta这样的科技巨头争夺的战场,它们试图将用户留在自己的生态系统中。其他策略包括更专业化的应用,例如面向企业用例的个人助理和软件开发。 然而,正如我们的分析师在本报告中所述,尽管在人工智能转型方面做出了加强努力,但阻碍采用的几个因素依然存在。这包括高计算成本、数据可用性、数据安全性和整体系统复杂性。虽然在基础模型层面已取得很多进展,那里的投资资本似乎无穷无尽,但在应用层级的初创企业面临着更具挑战性的筹资环境,因为它们面临着证明商业可行性的短期压力。 保罗·康德拉 首席新兴技术研究负责人 Paul.Condra@Pitchbook.com 企业应用 布伦丹·伯克 高级分析师,新兴技术 brendan.burke@pitchbook.com 人工智能与机器学习 预期前期的冲击 在通用人工智能(GenAI)的崛起初期,我们见证了大型语言模型(LLMs)在企业用例中的局限性以及现在正在成熟的早期趋势迹象。预期的创新包括支持性LLM操作(LLMOps)行业的成熟,包括基础模型编排和向量搜索,以及AI代理。在OpenAI的GPT-4之后的连续模型发布局限性以及类似开源模型的泛滥加剧了对支持LLM软件的需求,要求用户从类似的生成模型中获得更高质量的输出。从长远来看,我们预计基础模型将创造更多价值超过100亿美元(10.0亿美元)的独角兽公司,而代码生成将比图像生成或聊天机器人更大程度上推进该领域。 一年后的现实 人工智能(AI)已经从根本但又仍然有限的方式改变了现有的AI与机器学习(ML)垂直领域。尽管新的大型语言模型(LLM)代表了行业的未来,但它们并没有消除旧有方法,预存在的模型仍然多于LLM应用。根据IDC的估计,GenAI软件将在2024年贡献约14%的AI软件支出,达到145亿美元,且按计划到2028年仅贡献支出总额的32.3%。1即便如此,构建传统机器学习模型的公司,包括DataRobot的估值下降了90%以上和H20.ai的估值下降了80%以上,面对通用人工智能的颠覆性影响。2关于模型技术的新研究可以在软件的确定性领域进一步推进该领域,如我们所述的:分析师关于基础模型的研究报告大语言模型创新者在从他们预测先前的产品中夺取心智份额和市场份额。 企业推广进度比最初预测的要慢,模型也没有继续吸收新的功能。由于应用采用率的迟缓,基础设施层,包括模型架构实验室和半导体初创公司,在LLMOps领域达到了我们跟踪的39家独角兽估值中的25家。半导体、模型研究实验室和初创云服务提供商显示出对新堆栈的需求,并证明了在没有显著的外围生态系统的情况下创造新的软件创新的能力。我们没有预料到初创云服务提供商的需求,包括CoreWeave、Crusoe、Lambda和Together AI。新型半导体在LLM推理和数据中心网络方面取得了突破,建立在NVIDIA GPU生态系统之上,包括Astera Labs、Cerebras和Groq的生态系统。 其他软件类别面临着证明其合法性的挑战。我们观察到2023年针对通用人工智能操作软件的VC交易数量翻倍,包括数据准备、模型编排和应用部署,预计2024年将实现进一步50%的增长。然而,交易价值并未跟上基础设施层的增长。这些大型语言模型操作公司并未独立成长,考虑到超大规模企业提供的配置选项和持续改进的功能。特别是,向量数据库已经商业化,且不太可能成为一个增长类别,因为开源选项扩展了其网络效应,而现有数据库提供向量支持。人工智能代理领域已经变得拥挤,但我们相信它将被更具行动导向的模型功能所颠覆。由于收购者监控大型语言模型工具的货币化,很少对模型编排公司进行收购以证明早期阶段VC投资的合理性。 PitchBook用户可以访问一份完整的AI代理初创公司列表。此处. 实际世界进展 在长期来看,商业收益很可能会在通用人工智能(AGI)可能使软件变得无关紧要之前实现。现有的企业通过积极的创业投资已经占据了比去年更为明显的地位。我们预测,在OpenAI之后将会创立更多的100亿美元级别的公司,这一预测已经通过Anthropic、CoreWeave和Scale AI的成立得到了证实,然而,其他竞争者在接受大科技公司的出价之前并未达到这一总数,包括Adept AI、Character.AI和Inflection AI。在软件开发中,AI的采用已经加速到广泛,大型客户依赖于AI代码生成。编码助手初创公司在2024年上半年的融资超过了10亿美元,而在2023年仅为4.806亿美元,这表明了技术的成功和市场规模的扩大。生成性媒体落后于预期,多媒体内容套件和视频生成领域的风险投资下降。垂直领域公司面临着“空中楼阁”的指控,因为它们将通用LLM与客户工作流程相匹配,并且有时在产品推出之前会等待基础模型得到改进。 加密货币 罗伯特·利 高级分析师,新兴技术 robert.le@pitchbook.com 预期前期的冲击 一年前,人们认为人工智能在加密空间内的影响可能是颠覆性的,特别是在通用人工智能(GenAI)快速崛起的背景下。当时预期,人工智能将显著提升智能合约的开发和审计,特别是通过OpenAI的ChatGPT和GitHub的Copilot等工具。人工智能在Solidity、Vyper和Move等编程语言中的代码编写和调试能力预计将使智能合约的创建更加民主化,让更多开发者能够接触到。此外,人工智能还被预期简化区块链数据的查询,这一任务即便在Etherscan和The Graph等工具的帮助下也因其复杂性而著称。ChatGPT的自然语言处理能力预计将使用户能够直接提问有关区块链数据的问题,从而让数据对非技术用户更加易于访问。 另一个预期的影响是在协议和代币经济学文档的领域。许多加密项目需要广泛的文档,预计人工智能将通过生成白皮书、技术指南和其他必要文档来简化这一过程。在市场分析和交易中,人工智能在市场趋势、链上活动和来自各种来源的情绪分析方面的作用也预计将非常显著,有望帮助做出更明智的投资决策。此外,人们还相信去中心化基础设施可以从人工智能中受益,因为区块链技术可以促进人工智能模型的去中心化训练,从而产生透明且无需信任的大型语言模型版本。 随着人工智能技术的降价和提升,人们预期在人工智能领域取得胜利的是大型、成熟的加密平台以及拥有大量数据资源并能投资于人工智能整合的项目。除非它们能通过第三方平台或建立战略合作伙伴关系来利用人工智能,否则较小的或资金较不足的项目被视为潜在输家。 一年后的现实 一年后,AI对加密空间预期影响的一些方面开始显现,尽管成功率各有不同。AI已经开始在智能合约开发和审计中发挥作用,但采用速度较慢,这很可能是因为开发人员仍然习惯于使用旧工具。此外,虽然AI工具在编写和调试智能合约代码方面显示出潜力,但加密特定语言的复杂性和对人类监督的需求已经缓和了采用的步伐。 区块链数据查询的进展更为显著。AI驱动的工具正开始简化访问和解读区块链数据的过程。然而,广泛的采用仍然受到需要与现有平台更深层次整合的制约,以及确保数据准确性和可靠性的持续挑战。 其中更令人惊讶的发展之一是使用区块链技术构建去中心化AI(DeAI)的初创企业的爆炸式增长。加密货币可以作为对抗AI日益集中化和不透明性质的平衡力量。尽管像GPT-4和Claude 3这样的AI模型由少数实体授权和控制,但加密货币生态系统提供了一个无需授权、透明和去中心化的替代方案。这种动态为加密货币和AI交叉的独特用例打开了大门,例如使AI代理能够在去中心化网络中自主执行任务和交换价值。 加密货币也可以作为用于训练AI模型的激励和控制机制,确保数据使用的更大透明度和公平性。此外,由加密货币驱动的去中心化计算系统可以民主化AI硬件的访问,使先进的计算资源更广泛地可用,并降低AI创新的门槛。尽管去中心化AI训练和推理的概念非常吸引人,但其实际实施已被证明是困难的,这主要归因于在去中心化网络中分配训练过程的技 实际世界进展 区块链开发平台Alchemy推出了ChatWeb3,这是一款旨在为开发者提供与区块链数据和智能合约交互的对话界面的工具。它允许用户就区块链交易、智能合约状态以及其他Web3相关数据提出自然语言问题,从而使得获取和分析信息更加便捷,无需编写复杂的查询或代码。Graph发布了路线图,展示了其引入先进的AI驱动工具和功能,以增强区块链数据的索引和查询。这一进步可以直接支持智能合约开发,通过简化区块链数据的检索、分析和整合,使智能合约的功能更加复杂化和数据驱动。 已经有很多关注点放在了AI开发的去中心化上,使用加密货币作为鼓励开发贡献的激励机制。例如,Sentient在2024年7月进行了一轮8500万美元的种子轮融资,旨在创建一个开放的AI经济,让开发者和创作者可以合作、货币化他们的AI模型,并参与AGI的开发。Sentient的平台利用区块链协议来确保经济协调并补偿创作者的AI模型。Sahara AI,在2024年8月筹集了4300万美元的A轮融资,是一家类似的构建基于区块链的平台的公司,该平台确保了AI资产的透明所有权、治理和补偿。平台的关键组件包括一个AI原生区块链、一个DeAI市场、开发工具和安全的存储解决方案。该平台旨在提供一个协作环境,让贡献者可以安全地创建、共享和交易AI模型和数据。 数据分析 布伦丹·伯克高级分析师,新兴技术 brendan.burke@pitchbook.com 预期前期的冲击 我们去年的一篇笔记涵盖了人工智能(AI)在物联网(IoT)中的应用。自那时起,我们已经将我们的物联网覆盖范围转向数据处理分析,以更好地反映在工业环境中产生影响的科技。我们的数据分析发布报告阐述了垂直领域通用人工智能(GenAI)的初始应用,包括结构化查询语言(SQL)生成、数据转换和商业智能可视化。这些用例也适用于工业环境,初创公司正在构建定制的AI模型,以分析特定领域的数据集,并使用定制化的查询语言。由于在互联网文本上的训练,量化数据分析最初并未成为大型语言模型(LLMs)的主要用例。早期演示,如OpenAI的代码解释器,展示了LLMs学习数据模式并生成可视化的潜