热门搜索：

互联网传媒行业：AI时代新起点，寻新投资方向（三），AI Agent，大模型时代重要落地方向

信息技术2023-10-12东吴证券M***

AI智能总结

AI Agent是AI领域的重要发展方向，它结合了大模型LLM和规划能力、记忆和工具，可以实现复杂流程的自动化和模拟人类行为。自主智能体和智能体模拟是AI Agent的两大方向，自主智能体适用于较简单的任务，而智能体模拟则更强调与环境的交互和拟人化。建议关注在AI Agent方向有布局的公司，如昆仑万维、中文在线、盛天网络等。此外，游戏板块和IP资源也是值得关注的投资方向。风险提示包括产业进展不及预期、监管风险和市场竞争加剧等。

互联网传媒行业：AI时代新起点，寻新投资方向（三），AI Agent，大模型时代重要落地方向

证券研究报告·行业深度报告·互联网传媒 AI时代新起点，寻新投资方向（三） AIAgent，大模型时代重要落地方向增持（维持）证券分析师：张良卫执业证书编号：S0600516070001联系邮箱：zhanglw@dwzq.com.cn 研究助理：郭若娜执业证书:S0600122080017 guorn@dwzq.com.cn 2023年10月12日 大模型时代的AIAGENT=LLM+规划能力+记忆+工具。AI领域AGENT概念由来已久，这一轮LLM给AIAGENT提供了突破性技术方案，对AIAGENT性能表现至关重要；同时需借助外部工具在实际应用中保持长期一致性和准确性。目前AIAGENT的探索大致分为自主智能体和智能体模拟。 方向一：自主智能体，力图实现复杂流程自动化。自主智能体有望带来软件行业交互方式和商业模式变革。基座大模型能力解决下限问题，在实际企业应用场景中自主智能体的架构设计、工程能力、垂类数据质量等也至关重要，垂类/中间件玩家亦有机会。其中，单智能体相对更适用于较简单的任务，在C端应用上有一定潜力，代表性玩家包括中心化应用的ChatGPT、去中心化应用的adeptAI、可定制和平台化的Cortex、MindOS等；但其在B端场景上略显乏力，基本无法完成较为复杂的工作，多智能体优势相对更加突出。代表性玩家包括MetaGPT、ChatDev、Showrunner。 方向二：智能体模拟，力图更加拟人可信。1）陪伴类智能体强调情感情商等人类特征，具有“人格”，且能够记住与用户的历史交流，代表应用如PI、Characterai、replica、glow等。我们认为国内情绪消费市场仍有较大想象空间，陪伴类智能体或受益于情绪消费趋势红利，成为LLM时代重要的AI原生应用。我们预计陪伴类智能体大部分商业价值集中在供给方而非平台，我们更加看好具备丰富IP储备或者能让用户定制智能体的玩家。2）交互智能体：强调与环境交互的能力，智能体之间/与虚拟世界内事物之间可互动，可能涌现出超越设计者规划的场景和能力，大模型不确定性反而成为优势，有望成为AIGC重要部分。特别是对开放世界游戏等行业，可增强玩家沉浸感，解决开放世界内容消耗快的问题；多可信agent技术成熟后可能会孵化出新的游戏品类。代表项目如斯坦福大学开源的Smallville小镇，应用如网易《逆水寒》、昆仑万维《ClubKoala》。 投资建议：1）推荐在AIAGENT方向有直接布局的昆仑万维、中文在线、盛天网络，建议关注天地在线等。2）游戏板块推荐研运能力出色且产品储备充沛的厂商：恺英网络、吉比特、三七互娱、巨人网络、宝通科技等，港股的创梦天地等，建议关注神州泰岳、世纪华通等。3）IP资源建议关注艺人IP（华策影视等）、影视IP（光线传媒、奥飞娱乐、博纳影业、上海电影、中国电影等）。4）教育推荐南方传媒、凤凰传媒、皖新传媒、新东方，建议关注世纪天鸿、好未来、高途集团、科大讯飞、佳发教育、盛通股份、传智教育、鸿合科技等；电商及企业服务推荐焦点科技、华凯易佰、吉宏股份;创作类自主智能体发展有助于提高内容行业生产效率，推荐动画电影龙头光线传媒。 风险提示：产业进展不及预期，监管风险，市场竞争加剧风险 1.AIAGENT：LLM提供新基座，自动化/拟人化是两大方向  1.1 AIAGENT：感知并反应，具备自主性/可迭代/规划性  1.2 新时代AIAGENT：LLM+规划+记忆+工具  1.3 两大方向：自动化（自主智能体）、拟人化（智能体模拟） 2.自主智能体：自动化，新一轮生产力革命 2.1自主智能体：软件新范式，非大模型玩家亦有机会 2.2自主智能体：实验性VS实操性，单智能体VS多智能体 3.智能体模拟：拟人化，新的精神消费品 3.1陪伴类，提供情绪价值 3.2重交互，提高用户体验 4.投资建议 5.风险提示 1、AIAGENT：LLM提供新基座，自动化/拟人化是两大方向 1 1.1AIAGENT：感知并反应，具备自主性/可迭代/规划性 智能体agent：通过传感器感知环境（收集信息）并通过执行器作用于该环境（采取行动）的事物。Agent概念最早起源于M.Minsky(AI之父之一）于1986年出版的《SocietyofMind》（也是神经网络热潮开始的年份），1994年AI学术界内便已开始较多对agent的讨论，本篇报告我们采用22年出版的《人工智能：现代方法》（第四版）中的定义。 理性智能体概念是研究人工智能方法的核心。区别于普通计算机程序，理性智能体具备自主性、可学习迭代、可制定并实现目标等特点。人工智能专注于研究和构建做正确的事情的智能体——理性智能体（RationalAgent/IntelligentAgent，也是本报告“AIAGENT”定义），即设计理性智能体程序实现智能体函数，完成从感知到动作的映射。对于每个可能的感知序列，给定感知序列提供的证据和智能体所拥有的任何先验知识，理性智能体应该选择一个期望最大化其性能度量的动作。图：智能体通过传感器和执行器与环境交互图：智能体结构拆解智能体=架构+程序具备物理传感器和执行器的计算装置，使程序可以使用来自传感器的感知，运行程序，并将程序生成的动作选择反馈给执行器将当前感知作为传感器输入，将动作返回给执行器，是智能体函数的具体实现。 •智能体函数：抽象的数学描述，描述智能体行为，将任意给定的感知序列映射到一个动作；可能依赖整个感知历史 1.2新时代AIAGENT：LLM+规划+记忆+工具，大模型重要落地方向 大模型时代的AIAGENT=LLM（核心控制器，构建核心能力）+规划能力+记忆+工具。其中基座模型能力至关重要。 •我们认为LLM给AIAGENT底层提供了一个突破性技术方案：过去强化学习基于深度学习框架可让agent学到技能，但agent本身并没有真正理解问题和技能，泛化性也较差，只能用于特定领域，主要用在游戏和用来制作低维控制/计划，代表性应用是围棋领域的AlphaGo；LLM带来了深度学习新范式，思维链和强大的自然语言理解能力有望让agent具备强大的学习能力和迁移能力，从而让创建广泛应用且实用的agent成为可能。 •由于生成式LLM存在幻觉问题，记忆力短，在实际应用中难以保持长期一致性和准确性，且agent间合作也是重要趋势，除了等待基座模型自身迭代之外，借助外部力量（向量存储、检索、代码等）是重要方法，完整的AGENT框架应该具备这些能力。我们认为补齐了大模型短板的AIAGENT更具备实用性，将是大模型重要落地方向。前特斯拉总监、OpenAI科学家Karpathy公开表示“如今AI智能体才是未来最前沿的方向”“相比大模型训练，OpenAI内部目前更关注Agent领域”。 action Agent reward Environment 强化学习 1954年 Minsky首次 1957年 Bellman提出求解 1989年 Watkins提出的Q学习拓 2013年 DeepMind发表利用强化学 2016年基于深度强化学 state 提出“强化”最优控制问题及最和“强化学优控制问题的MDP习”概念的动态规划方法展强化学习应用和完备强化学习，成为最广泛使用的强化学习方法习玩Atari游戏的论文习的AlphaGo打败顶尖职业棋手李世石 LLM+强化学习 LLMAgent 用户需求提示工程外部工具 LLM 搜索缓存器数据库代码解释器结果任务导向训练 •调整指令 •RLHF •RL •语料库调优专有日志神经网络 1986年 2006年 2012年 2017年 2018年 2020年2022年 DavidRumelhart、 GeoffreyHinton提出无监督 CNN网络AlexNet夺得谷歌提出谷歌发布BERT，OPENAI发布 Chatgpt发布 GeoffreyHinton等人将BP 预训练+有监督训练微调的解ImageNet冠军，碾压第Transfor 成主流；OPEN GPT3，开启练算法应用在多层感知机上决方案，深度学习浪潮开启二名的分类性能 -mer架构 AI发布GPT1 大模型时代组件 AGENT设定规划记忆工具子目标和分解反思和完善感知记忆短期记忆长期记忆内涵确定agent角色大模型解析用户请求，并将其分解为多个任务并根据其知识规划任务顺序及依赖关系。可自我批评和反思，从错误中吸取教训，完善未来步骤。可映射为基于原始输入，如文本/图片或其他模态做embedding 情境学习能力，受到模型有限上下文窗口长度的限制。长时间保留和回忆信权重息的能力，行为更加一致、合理、有效调用外部API获取模型中缺失的额外信息，包括当前信息、代码执行能力、对专有信息源访问等能力提示工程/大模型生成能力/数据大模型对自然语言理解生成能力、逻辑分析能力等提示工程大模型短板，需借助外部力量路径手动输入/llm生成/ 数据集对齐思想链、思维树、外部规划模型反馈、环境反馈、人类反馈 prompt 通常利用外部向量存储和快速检索实现 MRKL架构、TALM、HuggingGPT、API-Bank 表：LLMAgent重要组件拆解 • • • • 1.3两大方向：自动化（自主智能体）、拟人化（智能体模拟）通用智能体工具智能体模拟智能体 结合目前学术界和产业界基于LLM开发的AIAGENT应用情况，我们将目前AIAGENT划分为两大类： •自主智能体，力图实现复杂流程自动化。当给定自主智能体一个目标时，它们能自行创建任务、完成任务、创建新任务、重新确定任务列表的优先累级、完成新的首要任务，并不断重复这个过程，直到完成目标。准确度要计求高，因而更需要外部工具辅助减少大模型不确定性的负面影响。论 •智能体模拟，力图更加拟人可信。分为强调情感情商的智能体以及强调交文互的智能体，后者往往是在多智能体环境中，可能涌现出超越设计者规划数的场景和能力，大模型生成的不确定性反而成为优势，多样性使其有望成量为AIGC重要组成部分。 •我们认为两大方向并不是完全割裂的，相反，自动化与拟人化将作为aiagent两大核心能力并行发展，随着底层模型成熟以及行业探索更加深入，有望进一步扩大aiagent适用范围，提升其实用性。图：基于LLM的AGENT领域产品增长情况具身智能体游戏智能体网页智能体助手智能体图：当前AIAGENT两大方向——自主智能体和智能体模拟对比准确度要求记忆外部工具当前应用初始动力用户给定自主智能体高短期记忆为主较多 AutoGPT、chatgpt+插件、adept、metagpt等开发者设定的内部目标智能体模拟一般，更多要求拟人程度短期记忆+长期记忆较少Pi、Smallville小镇、Voyager、GITM等 2、自主智能体：自动化，新一轮生产力革命 5 自主智能体，力图实现复杂流程自动化。真格基金管理合伙人戴雨森将AI和人类协作的程度类比为自动驾驶的不同阶段，AIAgent约为自动驾驶的L4阶段，Agent完成任务，人进行外部辅助和监督。 自主智能体有望带来软件行业交互方式和商业模式变革： •交互方式变革：相比过去的APP/软件，从人适应应用变成应用适应人，Agent的决策/规划/执行等环节需要更深的用户需求理解以及更强的工程细节打磨。如目前Agent运行中常常遇见无休止的扩展、误解输出格式等问题，这类问题不单单依靠大模型能力提升，对Agent架构的设计和垂类数据的学习也有要求。 •商业模式变革：按服务内容收费转换成按token收费，对Agent功能实用性要求更高。 基座大模型能力固然重要，但其只能解决下限问题，在实际企业应用场景中自主智能体的架构设计、工程能力、垂类数据质量等也至关重要，垂类/中间件玩家

点击免费查看完整报告

你可能感兴趣

互联网传媒行业：AI时代新起点，寻新投资方向（三），AI Agent，大模型时代重要落地方向

你可能感兴趣

互联网传媒行业海外应用映射之生产力篇：AI时代新起点，寻新投资方向（一）

互联网传媒行业海内外AI应用之游戏篇：AI时代新起点，寻新投资方向（二）

互联网传媒行业深度报告：海外应用映射之生产力篇-AI时代新起点，寻新投资方向（一）

互联网传媒行业深度报告-AI时代新起点，寻新投资方向(一)：海外应用映射之生产力篇

AI时代新起点，寻新投资方向（四）：AI大模型持续迭代带来教育行业创新机遇