证券研究报告|行业专题 计算机 行业投资评级|优于大市(维持) 2024年11月27日 AIAgent:海外创新企业的再次自我革命 证券分析师 姓名:陈涵泊 资格编号:S0120524040004 邮箱:chenhb3@tebon.com.cn 证券分析师 姓名:李佩京 资格编号:S0120524090004 邮箱:lipj@tebon.com.cn 研究助理 姓名:王思 邮箱:wangsi@tebon.com.cn 0 核心逻辑 AIAgent:大模型开启推理时刻,算力成本降低推动产业化进程。AIAgent是一种能够感知环境、进行决策和执行动作的智能实体,具备通过独立思考、调用工具去逐步完成给定目标的能力,可拆解为大模型+规划+记忆+工具使用四个组成部分。我们认为,AIAgent的产业发展离不开AI大模型的进步和推理成本的下降,当前已初步具备发展条件。1)o1掀起推理的划时代革命,通过思维链开启推理ScallingLaw时刻。根据TheInformation,传统的大模型ScalingLaw已经撞墙,OpenAI发布了全新的多模态Self-playRL模型o1,o1开创模型scaling的新维度,模型性能不再仅仅受限于预训练阶段,现在可以通过增加推理计算资源来提升模型表现。2)国内外算力供需错配现象改善,算力部署成本有望下降,有利于Agent产业化推广。从AI算力租赁成本来看,租赁价格今年较去年缩水70%。根据PANews,去年由于AI算力供应紧张,H100的租赁价格高达每小时8美元,但现在市场上算力供应过剩,价格降到了每小时2美元以下。 产业进程:国内外科技厂商共振,美国涌现多款垂类AIAgent取得显著进展。大模型能力增长遇瓶颈,国内外科技大厂转向AIAgent。国外来看,OpenAI、Google、Anthropic正在将注意力从模型转移至一系列AIAgent工具上,Anthropic推出Computeruse,变革人类与PC交互方式,OpenAI、Google也将Agent应用排上日程;国内来看,智谱抢跑发布AutoGLM,百度、腾讯、钉钉等互联网大厂纷纷跟进。我们认为,随着企业数字化进程不断发展,部分企业已积累了大量的数字文档、资料等,具备行业know-how的企业更有能力推出Agent应用,美国垂直领域龙头不断落地AIAgent。1)AI+营销:AppLovin,AXON赋能广告实现精准投放;2)AI+数据分析:Palantir,AI加速数据智能整合、分析和决策;3)AI+CRM:Salesforce,Agent起到提高员工效率和员工人数的作用;4)AI+办公:微软连出10款AIAgent,涵盖销售、运营、服务三类,内部Copilot和Agent重塑各个部门的业务流程,扩大员工工作效能;5)AI+教育:Duolingo,AI助力教育行业应材施教,有望加速提高用户付费率。 商业成效:Agent用户粘性增强,商业模式完善实现初步兑现。AIAgent可以实现员工与数字生产力的协作,直接带来企业价值。根据甲子光年,截至2030年,AI在全球各行业可能创造的价值将近3.8万亿美元。从用户访问量来看,AI应用访问量阶段性向好,用户使用习惯或已养成。根据10月AI产品榜单,全球前 20AI产品Web访问量基本都在增长,其中微软的copilot增速最快,达到87.57%。我们认为,在行业领域具备know-how,深入了解客户需求后开发出的垂类Agent,如果长期来看能够帮助企业提升的产能大于投入的成本,就有望形成付费,从而实现Agent价值兑现。近期海外AI应用业绩大爆发,初步验证垂类AIAgent的商业价值,资本市场表现亮眼。Applovin、Palantir、Innodata2024年初至11月26日股价涨幅分别为750.36%、296.50%、418.23%。 投资建议:我们认为,随着底层大模型沿着推理端不断迭代,AIAgent迎来良好的产业发展基础,美股AIAgent已在B端例如广告营销、数据分析、办公应用、教育等多个领域取得显著进展,成为业绩增长的驱动力。未来,随着用户对AI应用关注度和使用粘性提高,在垂类场景具备行业know-how的厂商有望率先受益。建议关注:1)toBAgent:泛微网络、致远互联、金蝶国际、彩讯股份、鼎捷软件、汉得信息、用友网络、科大讯飞、金证股份、华策影视、中国软件国际;2)toCAgent:金山办公、万兴科技、福昕软件、彩讯股份;3)AI多模态:万兴科技、虹软科技、当虹科技、中科创达、大华股份、海康威视、漫步者、萤石网络、汉仪股份、美图公司、云从科技等。 风险提示:技术迭代不及预期、国内AIAgent商业化进展不及预期、算力供应不及预期、行业竞争加剧风险等。 请务必阅读正文之后的信息披露及法律声明。1 目录CONTENTS 01 AIAgent:底层技术愈发成熟,算力成本降低开启产业化篇章 02 产业进程:国内外科技厂商共振,场景化AIAgent落地加快 03 商业成效:Agent用户粘性增强,商业模式完善实现初步兑现 04 投资建议和风险提示 请务必阅读正文之后的信息披露及法律声明。2 01 AIAgent:底层技术愈发成熟,算力成本降低开启产业化篇章 1.1、AIAgent:感知环境,自主行动,更广泛的人机融合 1.2、大模型:实现复杂任务规划,推理的ScallingLaw时刻 1.3、算力:国内外算力保障供给,Agent推理成本有望下降 1.1AIAgent:感知环境,自主行动,更广泛的人机融合 AIAgent是一种能够感知环境、进行决策和执行动作的智能实体,具备通过独立思考、调用工具去逐步完成给定目标的能力,可拆解为大模型+规划+记忆+工具使 用四个组成部分。例如,与每一步都需要人工输入的传统人工智能工具不同,AutoGPT代理可在后台持续工作。它们会根据所规划的目标开展行动,并可自主运行。 大模型:充当Agent的大脑,配合规划、记忆、工具高效完成任务。 规划:子目标和分解,Agent将大任务分解为较小、可管理的子目标,使其能够有效处理复杂任务;反思和完善,Agent可以对过去的行为进行自我批评和自我反思,从错误中学习,并为未来的步骤进行完善,从而提高最终结果的质量。 记忆:短期记忆,所有的上下文学习都是利用模型的短期记忆进行学习;长期记忆,这为Agent提供了在长时间内保留和回忆(无限)信息的能力,通常通过利用外部向量存储和快速检索来实现。 工具:学会调用外部API以获取模型权重中缺失的额外信息(经常在预训练后难以更改),包括当前信息、代码执行能力、访问专有信息源等。 AIAgent带来更广泛的人机融合。基于大模型的Agent不仅可以让每个人都有增强能力的专属智能助理,还将改变人机协同的模式,带来更为广泛的人机融合。智能体(Agent)模式中,人类设定目标和提供必要的资源(例如计算能力),然后AI独立地承担大部分工作,最后人类监督进程以及评估最终结果。 AI 人类 AI 人类 人类完成绝大部分工作 人类和AI协作工作 AI完成大部分工作 Embedding模式 Copilot模式 Agent模式 AI全权代理 其中某(几)个任务 AI提供信息或建议 其中某(几)个任务 AI提供信息或建议 人类修改调整确认 设定目标 提供资源监督结果 任务拆分 工具选择进度控制 人类自主结束工作 人类自主结束工作 AI自主结束 工作 人类 人类设立任务目标 人类设立任务目标 AI 图表:LLM驱动下的AIAgentSystem概览图表:人类与AI协同的三种模式 1.2.1Agent性能依赖于推理能力,CoT为其重要手段 AIAgent的性能依赖于推理能力,思维链(CoT)提示技术是提升这一能力的重要手段。 就像人类一样,在从事复杂任务时,每一步之间往往会有一个推理过程。AIAgents也会借助ReAct组件(ReasoningandActing),将大模型的推理能力和行为决策紧密结合起来,使语言模型可以根据知识进行有逻辑地计划安排。 根据《ChainofThoughtPromptingElicitsReasoninginLargeLanguageModels》,思维链提示策略可以有效提升大型语言模型的推理能力。通过在输入中加入一系列中间推理步骤作为提示,引导模型按照类似人类的思维方式进行推理,从而提高其在各种复杂任务中的性能,进行更深层次的逻辑推理和问题解决。 Altman提出了AGI五级理论,推理能力提升是向L3智能体过度的重要环节。其中,AIAgent处于通过AGI的L3等级,智能体不仅能思考,还可以采取行动的AI系统,能够执行全自动化业务。L2等级所展现的强大推理和问题解决能力是达到Agent等级的重要环节,OpenAIo1模型为L2等级的代表。 图表:AGI五级理论图表:大模型引入CoT提高复杂任务准确性 等级内容 L1聊天机器人具有对话能力的AI,能够与用户进行流畅的对话,提供信息、解答问题、辅助创作等,比如聊天机器人。 L2推理者像人类一样能够解决问题的AI,能够解决类似于人类博士水平的复杂问题,展现出强大的推理和问题解决能力,比如OpenAIo1。 L4创新者能够协助发明创造的AI,具有创新的能力,可以辅助人类在科学发现、艺术创作或工程设计等领域产生新想法和解决方案。 L3智能体不仅能思考,还可以采取行动的AI系统,能够执行全自动化业务。 L5组织者可以完成组织工作的AI,能够自动掌控整个组织跨业务流程的规划、 执行、反馈、迭代、资源分配、管理等,基本上已经与人类差不多。 请务必阅读正文之后的信息披露及法律声明。 资料来源:GoogleResearch&BrainTeam《ChainofThoughtPromptingElicitsReasoninginLargeLanguageModels》, 5 APPSO微信公众号,甲子光年微信公众号,德邦研究所 1.2.2传统ScallingLaw已放缓,o1掀起推理的划时代革命 受制于高质量文本数据越来越少等原因,传统的大模型ScallingLaw已放缓。根据TheInformation,传统的大模型ScalingLaw已经撞墙,OpenAI下一代旗舰Orion遭遇瓶颈,仅仅增加模型规模已经不能保证性能的线性提升,且伴随着高昂成本和显著的边际效益递减。路透社发文表示,由于当前方法受到限制,OpenAI和其他公司正在寻求通向更智能AI的新途径。 OpenAI发布了全新的多模态Self-playRL模型o1,通过多步推理的方式,其在语言推理方面取得了傲人的成绩,开启了推理的ScallingLaw时刻。 o1开创模型scaling的新维度,模型性能不再仅仅受限于预训练阶段,现在可以通过增加推理计算资源来提升模型表现。OpenAI发现,随着强化学习的增加(训练时间计算)和思考时间的增加(测试时间计算),o1的性能会持续提高。 o1模型实现了结构化推理,展现思维链(COT)能力,将单个任务拆解成多个简单任务,提升回答的逻辑性。它通过让模型在回答复杂问题时,逐步解释每一步的推理过程,而不是直接给出答案。因此模型在回答问题时就像是人类在解题时那样,先思考每一步的逻辑,再逐步推导出最终的结果。具体来看,o1至少已经能够实现:提出假设,验证思路,反思过程这三种主要的逻辑推理能力。 我们认为,大模型已从GPT3.5的简单对话能力发展至o1的复杂任务规划解决能力,为AIAgent发展建立了技术根基,通过强化推理的方式迈开通过AGI的重要一步。 图表:o1性能随着训练时间和测试时间计算而平稳提升图表:o1在具有挑战性的推理基准上大大优于GPT-4o 1.3算力:国内外算力保障供给,Agent推理成本有望下降 国内外算力供需错配现象改善,算力部署成本有望下降,有利于Agent产业化 推广