计算机 行业投资评级|优于大市(维持) 2024年11月27日 AIAgent:海外创新企业的再次自我革命 证券分析师 姓名:陈涵泊 资格编号:S0120524040004 邮箱:chenhb3@tebon.com.cn 证券分析师 姓名:李佩京 资格编号:S0120524090004 邮箱:lipj@tebon.com.cn 研究助理 姓名:王思 邮箱:wangsi@tebon.com.cn 0 目录CONTENTS 01 AIAgent:底层技术愈发成熟,算力成本降低开启产业化篇章 02 产业进程:国内外科技厂商共振,场景化AIAgent落地加快 03 商业成效:Agent用户粘性增强,商业模式完善实现初步兑现 04 投资建议和风险提示 请务必阅读正文之后的信息披露及法律声明。2 01 AIAgent:底层技术愈发成熟,算力成本降低开启产业化篇章 1.1、AIAgent:感知环境,自主行动,更广泛的人机融合 1.2、大模型:实现复杂任务规划,推理的ScallingLaw时刻 1.3、算力:国内外算力保障供给,Agent推理成本有望下降 AIAgent是一种能够感知环境、进行决策和执行动作的智能实体,具备通过独立思考、调用工具去逐步完成给定目标的能力,可拆解为大模型+规划+记忆+工具使 用四个组成部分。例如,与每一步都需要人工输入的传统人工智能工具不同,AutoGPT代理可在后台持续工作。它们会根据所规划的目标开展行动,并可自主运行。 大模型:充当Agent的大脑,配合规划、记忆、工具高效完成任务。 规划:子目标和分解,Agent将大任务分解为较小、可管理的子目标,使其能够有效处理复杂任务;反思和完善,Agent可以对过去的行为进行自我批评和自我反思,从错误中学习,并为未来的步骤进行完善,从而提高最终结果的质量。 记忆:短期记忆,所有的上下文学习都是利用模型的短期记忆进行学习;长期记忆,这为Agent提供了在长时间内保留和回忆(无限)信息的能力,通常通过利用外部向量存储和快速检索来实现。 工具:学会调用外部API以获取模型权重中缺失的额外信息(经常在预训练后难以更改),包括当前信息、代码执行能力、访问专有信息源等。 AIAgent带来更广泛的人机融合。基于大模型的Agent不仅可以让每个人都有增强能力的专属智能助理,还将改变人机协同的模式,带来更为广泛的人机融合。智能体(Agent)模式中,人类设定目标和提供必要的资源(例如计算能力),然后AI独立地承担大部分工作,最后人类监督进程以及评估最终结果。 AI 人类 AI 人类 人类完成绝大部分工作 人类和AI协作工作 AI完成大部分工作 Embedding模式 Copilot模式 Agent模式 AI全权代理 其中某(几)个任务 AI提供信息或建议 其中某(几)个任务 AI提供信息或建议 人类修改调整确认 设定目标 提供资源监督结果 任务拆分 工具选择进度控制 人类自主结束工作 人类自主结束工作 AI自主结束 工作 人类 人类设立任务目标 人类设立任务目标 AI 图表:LLM驱动下的AIAgentSystem概览图表:人类与AI协同的三种模式 AIAgent的性能依赖于推理能力,思维链(CoT)提示技术是提升这一能力的重要手段。 就像人类一样,在从事复杂任务时,每一步之间往往会有一个推理过程。AIAgents也会借助ReAct组件(ReasoningandActing),将大模型的推理能力和行为决策紧密结合起来,使语言模型可以根据知识进行有逻辑地计划安排。 根据《ChainofThoughtPromptingElicitsReasoninginLargeLanguageModels》,思维链提示策略可以有效提升大型语言模型的推理能力。通过在输入中加入一系列中间推理步骤作为提示,引导模型按照类似人类的思维方式进行推理,从而提高其在各种复杂任务中的性能,进行更深层次的逻辑推理和问题解决。 Altman提出了AGI五级理论,推理能力提升是向L3智能体过度的重要环节。其中,AIAgent处于通过AGI的L3等级,智能体不仅能思考,还可以采取行动的AI系统,能够执行全自动化业务。L2等级所展现的强大推理和问题解决能力是达到Agent等级的重要环节,OpenAIo1模型为L2等级的代表。 图表:AGI五级理论图表:大模型引入CoT提高复杂任务准确性 等级内容 L1聊天机器人具有对话能力的AI,能够与用户进行流畅的对话,提供信息、解答问题、辅助创作等,比如聊天机器人。 L2推理者像人类一样能够解决问题的AI,能够解决类似于人类博士水平的复杂问题,展现出强大的推理和问题解决能力,比如OpenAIo1。 L4创新者能够协助发明创造的AI,具有创新的能力,可以辅助人类在科学发现、艺术创作或工程设计等领域产生新想法和解决方案。 L3智能体不仅能思考,还可以采取行动的AI系统,能够执行全自动化业务。 L5组织者可以完成组织工作的AI,能够自动掌控整个组织跨业务流程的规划、 执行、反馈、迭代、资源分配、管理等,基本上已经与人类差不多。 请务必阅读正文之后的信息披露及法律声明。 资料来源:GoogleResearch&BrainTeam《ChainofThoughtPromptingElicitsReasoninginLargeLanguageModels》, 5 APPSO微信公众号,甲子光年微信公众号,德邦研究所 受制于高质量文本数据越来越少等原因,传统的大模型ScallingLaw已放缓。根据TheInformation,传统的大模型ScalingLaw已经撞墙,OpenAI下一代旗舰Orion遭遇瓶颈,仅仅增加模型规模已经不能保证性能的线性提升,且伴随着高昂成本和显著的边际效益递减。路透社发文表示,由于当前方法受到限制,OpenAI和其他公司正在寻求通向更智能AI的新途径。 OpenAI发布了全新的多模态Self-playRL模型o1,通过多步推理的方式,其在语言推理方面取得了傲人的成绩,开启了推理的ScallingLaw时刻。 o1开创模型scaling的新维度,模型性能不再仅仅受限于预训练阶段,现在可以通过增加推理计算资源来提升模型表现。OpenAI发现,随着强化学习的增加(训练时间计算)和思考时间的增加(测试时间计算),o1的性能会持续提高。 o1模型实现了结构化推理,展现思维链(COT)能力,将单个任务拆解成多个简单任务,提升回答的逻辑性。它通过让模型在回答复杂问题时,逐步解释每一步的推理过程,而不是直接给出答案。因此模型在回答问题时就像是人类在解题时那样,先思考每一步的逻辑,再逐步推导出最终的结果。具体来看,o1至少已经能够实现:提出假设,验证思路,反思过程这三种主要的逻辑推理能力。 我们认为,大模型已从GPT3.5的简单对话能力发展至o1的复杂任务规划解决能力,为AIAgent发展建立了技术根基,通过强化推理的方式迈开通过AGI的重要一步。 图表:o1性能随着训练时间和测试时间计算而平稳提升图表:o1在具有挑战性的推理基准上大大优于GPT-4o 国内外算力供需错配现象改善,算力部署成本有望下降,有利于Agent产业化 推广。 1)国外英伟达B卡明年有望加速出货。根据英伟达FY25Q3最新季45 报,CEO黄仁勋表示,在经历过多次修改后,Blackwell芯片目前已全40 30 面投产;首席财务官ColetteKress表示,Blackwell芯片计划于本季度35 开始出货,并将在明年加速出货。25 2)国产芯片供应逐步向好。以海光与寒武纪为代表的国产算力202420 年存货、预付款表现均出现好转,或预示着国内AI芯片出货迎来好15 转。我们认为,华为昇腾、寒武纪思元和海光深算是国产算力的重要10 供给方,多轮迭代后可与英伟达主流芯片对标,基本能够满足小模型5 训练和下游应用的推理需求,国内算力供给好转有望满足Agent规模0 化推广推理算力需求。 从AI算力租赁成本来看,租赁价格今年较去年缩水70%。根据 图表:海光信息和寒武纪存货(亿元)情况 400% 350% 300% 250% 200% 150% 100% 50% 0% -50% -100% PANews,去年由于AI算力供应紧张,H100的租赁价格高达每小时8美元,但现在市场上算力供应过剩,价格降到了每小时2美元以下。目前,市场上H100的供应量远超需求,因此租用H100比购买更划算,投资购买新的H100已不再具有收益。 海光信息寒武纪海光qoq(右)寒武纪qoq(右) 图表:海光信息和寒武纪预付款项情况 预付款项水平(亿元) 2021Q4 2022Q1 2022Q2 2022Q3 2022Q4 2023Q1 2023Q2 2023Q3 2023Q4 2024Q1 2024Q2 2024Q3 海光信息 2.37 6.84 8.56 12.10 9.37 14.49 18.69 18.51 23.88 26.14 30.90 22.13 qoq 188.09% 25.19% 41.28% -22.51% 54.62% 28.93% -0.94% 29.02% 9.44% 18.21% -28.38% 寒武纪 0.85 1.06 0.90 1.78 0.08 0.08 0.08 1.33 1.48 2.05 5.50 8.54 qoq 91.94% 24.34% -14.74% 96.67% -95.34% -0.53% -7.99% 1651.68% 11.47% 38.50% 168.71% 55.22% 02 产业进程:国内外科技厂商共振,场景化AIAgent落地加快 2.1、大模型能力增长遇瓶颈,国内外科技大厂转向AIAgent 2.2、软件开发门槛大幅降低,千行百业爆款Agent/应用将至 2.3、垂类Agent:行业know-how显现,下一代AI应用重要场景 8 OpenAI、Google、Anthropic正在将注意力从模型转移至一系列AIAgent工具上,“贾维斯”未来将至。 Anthropic:10月23日,Anthropic发布了Claude3.5Sonnet升级版,推出革命性功能——Computeruse,可通过API即可实现AI与PC交互,替代人力进行使用计算机控制鼠标、键盘,包括查看屏幕、移动光标、点击按钮和输入文本等操作。 Google:根据TheInformation,Googel正在开发一个专门针对Chrome浏览器进行了优化的AIAgent,其代号为「ProjectJarvis」,将为用户执行任务,包括“收集研究资料、购买产品或预订航班”。ProjectJarvis或在今年12月公布,将由Gemini2.0提供AI支持,只能在Web浏览器上运行。ProjectJarvis在执行不同操作时,中间会有几秒钟的思考时间。此外,根据至顶网,谷歌云计划推出AIAgent合作伙伴计划以及新的AIAgentSpace,其目的是让客户在谷歌的在线市场上轻松查找、购买和部署合作伙伴的人工智能代理,推动生成式人工智能销售和客户增长。 OpenAI:据彭博社,OpenAI正准备推出代号为“Operator”的新型AIAgent工具,计划于2025年1月发布。该工具能够在用户的计算机上自动执行任务,如编写代码或预订行程。OpenAI计划在明年1月发布该工具的研究预览版,并通过公司的应用程序接口(API)向开发者开放。 公司 产品名称/发布/计划发布 代号 时间 功能表现 图表:Claude实现数据下载及分析的展示demo图表:海外大模型龙头厂商AIAgent布局情况 Anthropic Computer2024.10use 可通过API即可实现AI与PC交互,替代人力进行使用计算机控制鼠标、键盘,包括查看屏幕、移动光