证券研究报告·行业深度报告·互联网传媒 AI时代新起点,寻新投资方向(三) AIAgent,大模型时代重要落地方向 增持(维持) 证券分析师:张良卫 执业证书编号:S0600516070001联系邮箱:zhanglw@dwzq.com.cn 研究助理:郭若娜 执业证书:S0600122080017 guorn@dwzq.com.cn 2023年10月12日 大模型时代的AIAGENT=LLM+规划能力+记忆+工具。AI领域AGENT概念由来已久,这一轮LLM给AIAGENT提供了突破性技术方案,对AIAGENT性能表现至关重要;同时需借助外部工具在实际应用中保持长期一致性和准确性。目前AIAGENT的探索大致分为自主智能体和智能体模拟。 方向一:自主智能体,力图实现复杂流程自动化。自主智能体有望带来软件行业交互方式和商业模式变革。基座大模型能力解决下限问题,在实际企业应用场景中自主智能体的架构设计、工程能力、垂类数据质量等也至关重要,垂类/中间件玩家亦有机会。其中,单智能体相对更适用于较简单的任务,在C端应用上有一定潜力,代表性玩家包括中心化应用的ChatGPT、去中心化应用的adeptAI、可定制和平台化的Cortex、MindOS等;但其在B端场景上略显乏力,基本无法完成较为复杂的工作,多智能体优势相对更加突出。代表性玩家包括MetaGPT、ChatDev、Showrunner。 方向二:智能体模拟,力图更加拟人可信。1)陪伴类智能体强调情感情商等人类特征,具有“人格”,且能够记住与用户的历史交流,代表应用如PI、Characterai、replica、glow等。我们认为国内情绪消费市场仍有较大想象空间,陪伴类智能体或受益于情绪消费趋势红利,成为LLM时代重要的AI原生应用。我们预计陪伴类智能体大部分商业价值集中在供给方而非平台,我们更加看好具备丰富IP储备或者能让用户定制智能体的玩家。2)交互智能体:强调与环境交互的能力,智能体之间/与虚拟世界内事物之间可互动,可能涌现出超越设计者规划的场景和能力,大模型不确定性反而成为优势,有望成为AIGC重要部分。特别是对开放世界游戏等行业,可增强玩家沉浸感,解决开放世界内容消耗快的问题;多可信agent技术成熟后可能会孵化出新的游戏品类。代表项目如斯坦福大学开源的Smallville小镇,应用如网易《逆水寒》、昆仑万维《ClubKoala》。 投资建议:1)推荐在AIAGENT方向有直接布局的昆仑万维、中文在线、盛天网络,建议关注天地在线等。2)游戏板块推荐研运能力出色且产品储备充沛的厂商:恺英网络、吉比特、三七互娱、巨人网络、宝通科技等,港股的创梦天地等,建议关注神州泰岳、世纪华通等。3)IP资源建议关注艺人IP(华策影视等)、影视IP(光线传媒、奥飞娱乐、博纳影业、上海电影、中国电影等)。4)教育推荐南方传媒、凤凰传媒、皖新传媒、新东方,建议关注世纪天鸿、好未来、高途集团、科大讯飞、佳发教育、盛通股份、传智教育、鸿合科技等;电商及企业服务推荐焦点科技、华凯易佰、吉宏股份;创作类自主智能体发展有助于提高内容行业生产效率,推荐动画电影龙头光线传媒。 风险提示:产业进展不及预期,监管风险,市场竞争加剧风险 1.AIAGENT:LLM提供新基座,自动化/拟人化是两大方向 1.1 AIAGENT:感知并反应,具备自主性/可迭代/规划性 1.2 新时代AIAGENT:LLM+规划+记忆+工具 1.3 两大方向:自动化(自主智能体)、拟人化(智能体模拟) 2.自主智能体:自动化,新一轮生产力革命 2.1自主智能体:软件新范式,非大模型玩家亦有机会 2.2自主智能体:实验性VS实操性,单智能体VS多智能体 3.智能体模拟:拟人化,新的精神消费品 3.1陪伴类,提供情绪价值 3.2重交互,提高用户体验 4.投资建议 5.风险提示 1、AIAGENT:LLM提供新基座,自动化/拟人化是两大方向 1 1.1AIAGENT:感知并反应,具备自主性/可迭代/规划性 智能体agent:通过传感器感知环境(收集信息)并通过执行器作用于该环境(采取行动)的事物。Agent概念最早起源于M.Minsky(AI之父之一)于1986年出版的《SocietyofMind》(也是神经网络热潮开始的年份),1994年AI学术界内便已开始较多对agent的讨论,本篇报告我们采用22年出版的《人工智能:现代方法》(第四版)中的定义。 理性智能体概念是研究人工智能方法的核心。区别于普通计算机程序,理性智能体具备自主性、可学习迭代、可制定并实现目标等特点。人工智能专注于研究和构建做正确的事情的智能体——理性智能体(RationalAgent/IntelligentAgent,也是本报告“AIAGENT”定义),即设计理性智能体程序实现智能体函数,完成从感知到动作的映射。对于每个可能的感知序列,给定感知序列提供的证据和智能体所拥有的任何先验知识,理性智能体应该选择一个期望最大化其性能度量的动作。 图:智能体通过传感器和执行器与环境交互 图:智能体结构拆解 智能体=架构+程序 具备物理传感器和执行器的计算装置,使程序可以使用来自传感器的感知,运行程序,并将程序生成的动作选择反馈给执行器 将当前感知作为传感器输入,将动作返 回给执行器,是智能体函数的具体实现。 •智能体函数:抽象的数学描述,描述智能体行为,将任意给定的感知序列映射到一个动作;可能依赖整个感知历史 1.2新时代AIAGENT:LLM+规划+记忆+工具,大模型重要落地方向 大模型时代的AIAGENT=LLM(核心控制器,构建核心能力)+规划能力+记忆+工具。其中基座模型能力至关重要。 •我们认为LLM给AIAGENT底层提供了一个突破性技术方案:过去强化学习基于深度学习框架可让agent学到技能,但agent本身并没有真正理解问题和技能,泛化性也较差,只能用于特定领域,主要用在游戏和用来制作低维控制/计划,代表性应用是围棋领域的AlphaGo;LLM带来了深度学习新范式,思维链和强大的自然语言理解能力有望让agent具备强大的学习能力和迁移能力,从而让创建广泛应用且实用的agent成为可能。 •由于生成式LLM存在幻觉问题,记忆力短,在实际应用中难以保持长期一致性和准确性,且agent间合作也是重要趋势,除了等待基座模型自身迭代之外,借助外部力量(向 量存储、检索、代码等)是重要方法,完整的AGENT框架应该具备这些能力。我们认为补齐了大模型短板的AIAGENT更具备实用性,将是大模型重要落地方向。前特斯拉总监、OpenAI科学家Karpathy公开表示“如今AI智能体才是未来最前沿的方向”“相比大模型训练,OpenAI内部目前更关注Agent领域”。 action Agent reward Environment 强化学习 1954年 Minsky首次 1957年 Bellman提出求解 1989年 Watkins提出的Q学习拓 2013年 DeepMind发表利用强化学 2016年 基于深度强化学 state 提出“强化”最优控制问题及最和“强化学优控制问题的MDP习”概念的动态规划方法 展强化学习应用和完备 强化学习,成为最广泛使用的强化学习方法 习玩Atari游戏的论文 习的AlphaGo打败顶尖职业棋手李世石 LLM+强 化学习 LLMAgent 用户 需求 提示工程 外部工 具 LLM 搜索 缓存器 数据库 代码解释器 结果 任务导向 训练 •调整指令 •RLHF •RL •语料库调优 专有日 志 神经网络 1986年 2006年 2012年 2017年 2018年 2020年2022年 DavidRumelhart、 GeoffreyHinton提出无监督 CNN网络AlexNet夺得 谷歌提出 谷歌发布BERT,OPENAI发布 Chatgpt发布 GeoffreyHinton等人将BP 预训练+有监督训练微调的解ImageNet冠军,碾压第Transfor 成主流;OPEN GPT3,开启练 算法应用在多层感知机上 决方案,深度学习浪潮开启 二名的分类性能 -mer架构 AI发布GPT1 大模型时代 组件 AGENT设定 规划 记忆 工具 子目标和分解 反思和完善 感知记忆 短期记忆 长期记忆 内涵 确定agent角色 大模型解析用户请求,并将其分解为多个任务并根据其知识规划任务顺序及依赖关系。 可自我批评和反思,从错误中吸取教训,完善未来步骤。 可映射为基于原始输入,如文本/图片或其他模态做embedding 情境学习能力,受到模型有限上下文窗口长度的限制。 长时间保留和回忆信权重息的能力,行为更加一致、合理、有效 调用外部API获取模型中缺失的额外信息,包括当前信息、代码执行能力、对专有信息源访问等 能力 提示工程/大模型生 成能力/数据 大模型对自然语言理解生成能力、逻辑分析能力等 提示工程 大模型短板,需借助外部力量 路径 手动输入/llm生成/ 数据集对齐 思想链、思维树、外部规划 模型反馈、环境反馈、人类反馈 prompt 通常利用外部向量存 储和快速检索实现 MRKL架构、TALM、HuggingGPT、API-Bank 表:LLMAgent重要组件拆解 • • • • 1.3两大方向:自动化(自主智能体)、拟人化(智能体模拟) 通用智能体工具智能体模拟智能体 结合目前学术界和产业界基于LLM开发的AIAGENT应用情况,我们将目前AIAGENT划分为两大类: •自主智能体,力图实现复杂流程自动化。当给定自主智能体一个目标时, 它们能自行创建任务、完成任务、创建新任务、重新确定任务列表的优先累级、完成新的首要任务,并不断重复这个过程,直到完成目标。准确度要计求高,因而更需要外部工具辅助减少大模型不确定性的负面影响。论 •智能体模拟,力图更加拟人可信。分为强调情感情商的智能体以及强调交文互的智能体,后者往往是在多智能体环境中,可能涌现出超越设计者规划数的场景和能力,大模型生成的不确定性反而成为优势,多样性使其有望成量 为AIGC重要组成部分。 •我们认为两大方向并不是完全割裂的,相反,自动化与拟人化将作为aiagent两大核心能力并行发展,随着底层模型成熟以及行业探索更加深入,有望进一步扩大aiagent适用范围,提升其实用性。 图:基于LLM的AGENT领域产品增长情况 具身智能体游戏智能体网页智能体助手智能体 图:当前AIAGENT两大方向——自主智能体和智能体模拟对比 准确度要求 记忆外部工具当前应用 初始动力 用户给定 自主智能体 高短期记忆为主较多 AutoGPT、chatgpt+插件、adept、metagpt等 开发者设定的内部目标 智能体模拟 一般,更多要求拟人程度 短期记忆+长期记忆 较少Pi、Smallville小镇、Voyager、GITM等 2、自主智能体:自动化,新一轮生产力革命 5 自主智能体,力图实现复杂流程自动化。真格基金管理合伙人戴雨森将AI和人类协作的程度类比为自动驾驶的不同阶段,AIAgent约为自动驾驶的L4阶段,Agent完成任务,人进行外部辅助和监督。 自主智能体有望带来软件行业交互方式和商业模式变革: •交互方式变革:相比过去的APP/软件,从人适应应用变成应用适应人,Agent的决策/规划/执行等环节需要更深的用户需求理解以及更强的工程细节打磨。如目前Agent运行 中常常遇见无休止的扩展、误解输出格式等问题,这类问题不单单依靠大模型能力提升,对Agent架构的设计和垂类数据的学习也有要求。 •商业模式变革:按服务内容收费转换成按token收费,对Agent功能实用性要求更高。 基座大模型能力固然重要,但其只能解决下限问题,在实际企业应用场景中自主智能体的架构设计、工程能力、垂类数据质量等也至关重要,垂类/中间件玩家