热门搜索：

360-张锋-智能纽带：AI Agent在解决大模型应用难题中的关键作用

信息技术2024-08-212023第十二届全球TOP100软件案例研究峰会乐***

AI智能总结

智能纽带：AI Agent在解决大模型应用难题中的关键作用

一、大模型落地应用的长板和短板

长板：搜索、阅读、写作、绘画等基础能力。如New Bing、Perplexity、Jasper等。
短板：幻觉、知识/记忆、交互能力不足，难以应对复杂问题。

二、AI Agent的整体框架

架构：
- LLM大脑：核心控制器，支持Prompt模板降低写提示门槛。
- Planning：任务规划，将复杂任务分解为更小的目标。
- Tools工具箱：调用各种外部工具，涵盖搜索、文档检索、数据分析等。
- Memory记忆体：存储和检索外部上下文和行业知识。

三、AI Agent的应用案例

360数字员工：
- 功能：领域专家，定义工作流，执行任务，生成报告。
- 应用场景：旅游规划师、Github趋势分析师、IT运维等。
Microsoft Copilot：
- 功能：在TOC和TOB同时落地Agent框架，提供对话式插件卡，解决个人账单管理问题。
斯坦福“西部世界”虚拟小镇：
- 功能：25个小人（GPT agents）自由交互，展现出复杂的社会行为。

四、未来展望

多模态Agent：支持图像、视频、表单、代码等多种交互感知。
垂类Agent：通过分布式决策，实现自组织自决策。
AGI可能性：将LLM的能力延伸到更复杂的任务和更多的业务领域。

智能纽带：AIAgent在解决大模型应用难题中的关键作用张锋奇虎360AI研究院技术总监 www.top100summit.com www.top100summit.com “ 讲师简介请插入您的照片张锋奇虎360AI研究院技术总监 360人工智能研究院认知引擎负责人天津大学硕士毕业后，任职华为技术有限公司，先后从事计费产品的研发、设计及项目管理工作，主持参与参数AILab的建设，负责大数据平台、推荐平台和建模平台的建设和实施。其中推荐平台在四川电信落地后，显著提升了用户观看时长，大数据平台作为标品，落地数百个据点，成为部门主要现金流来源后续加入360公司，深耕于人工智能在互联网、物联网、数字化等领域的落地，带领团队主导360大模型的数据、训练、推理、应用等落地工作，以及建模平台、推荐平台、知识图谱平台等产品开发、设计及管理工作，相关成果落地于安全大数据、互联网、企业数字化、AIoT等360集团全量业务场景，支持千万级硬件设备，服务亿级用户 ” www.top100summit.com 目录 •LLM落地应用-长板和短板，及当前解决方案 •AIAgent的整体框架 •AIAgent的应用案例 www.top100summit.com LLM落地应用-长板和短板及当前最优解决方案 AGI发展回顾 2023 AGI被认为是人工智能的更高层次，它可以实现自我学习、自我改进、自我调整，解决任何问题而不需要人为干预。 1997 2016 2022 未来 1950 图灵机&图灵测试的提出深蓝战胜卡斯帕罗夫 AlphaGo 战胜李世石 ChatGPT 发布 AGI＆More… www.top100summit.com ChatGPT的探索，被认为是强人工智能拐点的到来、是超级人工智能雏形，即：LLMtoAGI www.top100summit.com Gemini：再强大的模型，也不万能 Gemini演示中并没有直接采用Agent，但是实际流程并没有两样我们以为的Gemini Gemini：你在玩石头、剪刀、布。实际的Gemini 问题1：告诉你看到什么 Gemini：我看到一个人的右手。手掌张开，手指分开Gemini：一个人敲木门 Gemini：我看到一只手伸出两个手指，这是数字二问题2：你觉得我在做什么？提醒：这是一个游戏。Gemini：你在玩石头、剪刀、布。 www.top100summit.com 7 大模型应用的能力长板——搜、读、写、画 1 写作 2 绘画 AI生产力 3 搜索 4 阅读 Jasper，CopyAI，Quillbot CanvaAI，ClipDrop，Pika NewBing，Perplexity，You，Phind ChatDoc，AskPDF 你可以轻易地让任何一个GPT生成一首诗、计算一道奥数题。然而工作中你不需要作诗，也不需要算奥数题。工作中面对是写不完的方案，做不完的报告，和看不完的邮件 www.top100summit.com 8 LLM应用的能力短板——幻觉、知识/记忆、交互 1 生成的幻觉问题商业场景使用对内容生成质量容错率极低，只通过简单知识问答，无法生成满意的内容和答案 2 记忆和行业知识问题参数再多、再强的模型，都无法也无法深入的了解一个行业。“海莲花常用的攻击方式是什么？” 3 提示词工程难度问题面对复杂问题，我们发现除了IT类员工，绝大部份企业员工没有兴趣去学习怎么写提示词 4 与现有信息化系统的协同问题企业不可能将现有信息化系统推倒重来大家的共同诉求是大模型能增强、协同、而非取代我们需要一个工具平台，让大模型“扬长避短”，实现大模型实际落地的“最后一公里” www.top100summit.com 9 LLM的落地工具：长期记忆、接口对齐、任务规划堆提示词技巧任务规划长期记忆复杂任务规划调度接口对齐存储外部上下文和行业知识对接外部系统 www.top100summit.com 10 解决靠堆参数、堆提示词无法解决的复杂推理等问题领域任务特定复杂任务：多工具使用开放复杂任务：自主性协同汇率问题，调用工具获取实时数据广州国庆七日游的亲子游计划，工具使用+多步执行自主规划和决策的树状复杂问题，路径优解工具可以有效拓展LLM的能力边界 www.top100summit.com 比照行业发展，我们做的就是AIAgent 用LLM作为大脑或这些智体控制者的主要组成部分，并通过多模态感知和工具利用等策略扩展其感知和行动空间 www.top100summit.com AIAgent的整体架构 www.top100summit.com AIAgent的架构：一套以LLM作为核心控制器的应用开发工具以LLM为核心控制器，结合Planning、Tools工具、Memory记忆等组件，解决实时数据获取、复杂任务等各类应用落地问题。 long-termMemory short-termMemory SensoryMemory Agent协作搜索任务分解 Memory （记忆体）资讯 LLM Planning （任务规划） Agents Tools （工具箱）天气 Tools 汇率 LLM辅助规划 Memory 规划调用LLM LLM（大脑）代码执行 … … FunctionCall Prompt ReAct ①LLM大脑：核心控制器。模型一键适配，Prompt模版降低写提示门槛。 ⒸPlanning：将任务拆解，流程具象化，就像工厂流水线一样，在这个流水线中，可以放置不同的工具完全任务的处理。 ⒸTools工具：让Agent学会调用各种外部工具，涵盖搜索、文档检索、数据分析、代码编写、教育、投资、出行、娱乐等各种应用。 ④Memory记忆：获取、存储、保留和后续检索信息的过程。包括知识库使用、长短期记忆。使用外部向量存储和快速检索。 *本架构与经典Agent架构略有区别 www.top100summit.com AIAgent：Planning规划能力，即任务分解和编排能力 Planning任务规划能力，实现方法主要两类： 人类参与：复杂任务，需要拆解为更小、更易于处理的子目标，需要人类进行辅助规划、结果校准。 自动编排：简单任务，通过PromptEngine来引导LLM实现规划，主要方式ReAct，FunctionCalling AIAgent：ReAct，增强LLM的推理和执行能力 ReAct框架，发挥LLM推理和执行能力的协同作用，通过问题分解+依靠外部能力来解决问题。 ReAct框架，在可解释性和可信赖性等方面，优于其他先进的基线。根据输入规划后续及流程何时终止思考观察行动 www.top100summit.com 整理返回结果辅助后续流程整理参数及调用 API www.top100summit.com Observation获取结果 Assistant 生成最终答案 AIAgent：FunctionCall 可以让开发者在调用语言模型时，通过用户提问和描述函数让模型智能地输出一个包含调用这些函数所需参数的JSON对象。 Assistan t选择调用函数，例如： API：CallSearch Param：北京要哪些景点？ Action 调用对应的ToolsCallSearch(“北京要哪些景点？”) 这种功能可以更可靠地将模型的能力与外部工具和API进行连接。 SystemP工具ro定m义pt User 用P户ro提m问，p例t如：北京要哪些景点？ www.top100summit.com AIAgent：Memory记忆，是LLM的内存和硬盘 Firstofall，人类擅长拥有不同类型记忆能力，而LLM很难理解新概念或者少量新数据。 1.感知记忆可以作为LLM或者多模态的Embedding输入表示（包括文本、图像等）。 2.短期记忆STM使用In-contextLearning，受到Transformer有限SeqLen长度限制（2Kto8K） 3.长期记忆LTM借助外部向量存储，Agent可以快速查询、快速检索，从而进行访问。 Embedding上下文学习向量数据库 www.top100summit.com AIAgent：Tools，学会使用工具是LLM进化的分水岭 Tools是LLM的武器库，学会使用工具，大模型获得了行动能力，打破大模型的应用边界。通用搜索地图搜索图片搜索新闻搜索新闻搜索 Onebox搜索股票汇率天气热搜百科热搜 SQLDB SparkDB SQLlite Redis Cassandra MongoDB Office Jira Confulence Email AirTable Zapier 搜索增强实时信息数据库办公 JSON CSV PDF Word PPT Excel Shell Python PowerShell GO JS BAT PowerBI CRM ERP Oauth EHR IM 格式代码业务系统 www.top100summit.com AIAgent的未来 AIAgent更多给我们呈现了一种AGI的可能性，将LLM的能力延伸到更复杂的任务和更多的业务领域。 多模态的Agent：多元化的交互感知（图像、视频、表单、代码）是Agent智能化方向之一。 万物皆可Agent：垂类Agent，通过分布式决策，实现自组织自决策 从LLM中来，到LLM中去：会有更多专业LLM服务 Agent www.top100summit.com AIAgent应用案例 www.top100summit.com 1.业界进展 GPTs：智能体的新纪元，普通人的AI 以模型能力为核心，支持记忆和外部API，在无需编码的情况下，可以构建个性化智能体，实现全民AI。 www.top100summit.com TOC:浏览器、搜索、桌面Copilot化 1.业界进展微软Copilot：在TOC和TOB同时落地Agent框架 MicrosoftCopilotEverything TOB:Graph、Office365、Connector www.top100summit.com 1.业界进展微软Copilot：在TOC和TOB同时落地Agent框架 Copilot构建示例-查账单仅大模型：无法获得个人预算账单解法：创造Flow“对话式插件卡” Action类别连接到数据源 Copilot：即Agent能力打通发布“个人账单总结”对话式插件从SAP里读某一行配置Action www.top100summit.com 1.业界进展 GenerativeAgents：智能体的互动涌现出复杂行为斯坦福“西部世界”虚拟小镇，在一个Smallville沙盒世界里住着25个小人(GPTagents)，互相自由沟通交互，出现了一系列的人类社会行为(信息传播、关系记忆和协作)。 www.top100summit.com 1.业界进展 AutomaticAgents：任务规划的早期探索者给Agents一个/多个目标，独立地执行这些目标。这些应用程序结合了工具使用和长期内存。典型的有AutoGPT，BabyAGI。 AutoGPT以LLM作为主控制器来建立AIAgents，作者提供了很多API代码来解析数据格式，帮助AIAgents更好地理解和处

点击免费查看完整报告