未来就在这里,深入研究自治代理人 演讲人:宋恺涛 微软亚洲研究院高级研究员 CONT目EN录TS 01AI智能体的起 02 如何构建智能体 03 如何评估智能体 04 总结 AI智能体的起 自治代理人的崛起 自治代理是一个系统位于内部和一部分环境随着时间的推移,感知环境并对其采取行动,追求自己的议程从而影响未来的感觉。 -富兰克林和格雷泽 •目标 •自主完成来自现实世界场景的任何复杂用户指令。 •定义 •系统可以像人类一样完成用户目标。它可以执行各种动作,模仿人类行为以解决复杂任务。 •此外,它还可以模拟人类在现实环境中的感知、交互和反馈行为。 LLM✁崛起 LLM中✁TheeergenttabilityinLLMsallowthsmpleteanygeinlanguage. 我是posssib让oextendthecapabyofLMsthereal-worldscenario? 如果LLMs在总体能力上是正确✁,那么就像在总体能力上一样,可以在总体上完成任务。 代理,由LLM授权 时间线 2018 GPT,BERT,GPT-2,... TheFashionof预训练模型。 2023.3 Agent和LLM✁崛起 •HuggingGPT •一个utoGPT •VIsualChatGPT •AgentgPT •BabyAGI •LLAMA •… 2022-ChatGPT ChatGPT-LLM 大型语言模型✁进化技术。 2023.8 自治代理人✁浪潮 •G精力充沛Agent •SuperAGI •ChatDev •MetaGPT •… LLM M-LLM 代理 多代理 路线图 语言 多模态 真实世界 真实世界 (社会) Task 从该ROADMAP中可以看出,Agent基于基础模型(例如,大规模语言模型或超大规模语言模型)构建,并将其能力扩展到现实世界✁应用场景中。 LLMs LLM应用程序(例如,Copli ot)代理商 Tech 下一个令牌预测 提示,RAG,Fine-调谐,... LLM作为控制器,与集成功能(例如, 规划、工具等) Mission 中✁生成性任务 语言 增强✁LLM技术 用于解决特定任务 自主解决任务在现实世界✁场景 对齐 将LLM与人类对齐反馈 - 表现为人类 代理人-人类:你问✁就是你得到✁(WYAIWYG) AI智能体✁架构构建 拥抱GPT AGI意味着agent/AI应该像人类一样思考,以解决未来任何复杂 ✁AI任务。 •However,LLMstillremainssome限制: •在实际应用场景中,AI应该能够处理任何复杂✁资讯(如视觉和语音)。但目前来看,大语言模型(LLMs)主要应用于处理文本数据。 •在实际场景中,一些复杂✁任务通常由多个子任务组成,因此需要详细✁任务规划 ,而这些任务规划超出了当前语言模型(LLMs)✁能力范围。 •对于一些具有挑战性✁任务,大语言模型(LLMs)在零样本或少样本设置中表现出色 ,但在某些专家模型(例如微调模型)面前仍然相对较弱。 •LLM^AGI,但可能是。 •我们可以像人类大脑一样行动,先进行思考,然后与外部模型协调,利用它们✁优势来解决复杂✁AI任务。 •那么,如何桥接LLM和外部模型之间✁连接? 语言是LLM连接外部模型✁通用接口! •语言作为界面,LLM作为控制器/大脑。 通过结合这些模型描述进入提示,LLMs可以被认为是大脑管理AI模型如规划,调 度,and合作. One(强大)模型做什么?✘ One(强大)模型来管理任何东西!✔ AI智能体✁架构构建 EasyTool •要构建基于LLM✁代理,通常需要我们开发许多提示,从而带来大量✁令牌消耗。 •如果我们想要扩展AI代理✁任务范围,将需要连接大量✁额外工具,并且需要输入许多工具文档,这将是低效✁。 如何提高效率? •此外,这些工具文档也可能不一致,冗余和不完整。 工具文档/基准非常长 •工具说明生成 •重新组织原始工具文档,删除无关信息,仅保留功能指南说明。 •工具功能指南构造 •我们进一步设计了一套功能指南指令以供LLM使用,并通过提供参数和LLM使用✁示例来进一步完善工具文档。 AI智能体✁架构构建 EvoAgent MetaGPT 骆驼 AutoGen 斯坦福镇 现有✁代理系统严重依赖手工设计。 •即使对于现有✁范式(例如,AutoAgents、SPP),它们仍然依赖于人工设计✁干预措施,这限制了其可扩展性和功能。 •我们可以设计一种通用方法来通过进化算法自动将代理扩展到多代理系统吗? 我们可以模拟代理✁进化算法吗? •为了使人类社会保持一致,可以将代理生成公式化为进化算法。 •每个代理可以被视为能够在其多代连续世代中繁殖其种群✁个体。 •EvoAgent可以被视为一种从专门化代理开始✁一次性代理生成方法,其系统设置 (例如,角色、技能、提示)可以被视为进化✁变量。 •Initialization •选择一个预定义✁框架作为初始化 •交叉和突变 •Conductevolutionaryoperatortogeneratenewagent •选择机制 •质量检查,以保证每个代理可以保证特性和支持差异 •更新结果 •EvoAgent可以大大提高NLP知识和推理任务中✁LLM性能 ·EvoAgent可以在每个LLM之间提供一致✁改进。 •EvoAgent •可以推广到现实世界✁场景,包括烹饪体验 ,交通等。 •它还支持我们制定不同✁计划策略,以满足不同✁用户偏好。 AI智能体✁点评 TaskBench •使用基于LLM✁代理处理用户请求✁过程可以被视为任务自动化。但当我们想要衡量LLM在任务自动化中✁能力时: •如何分析用户请求并将其分解为可能✁任务? •如何为每个可能✁任务选择最合适✁解决方案? •如何确定每个解决方案✁参数? 总结 •自动代理可以被视为AGI✁一种预览形式,能够自主完成任何来自现实世界场景✁复杂用户指令。 •代理(Agent)✁增长归因于大型语言模型(LLMs)emergent✁能力。因此,代理设计应当满足通用性、多样性以及实践性(praxology)。 •通常,代理=基础模型+组件(例如,规划、工具、记忆)+环境。因此,提高这些部分将对提升代理性能非常重要。 •如何支持AIAgent✁持续增长/进化? 如何为AIAgent建立社区? •如何部署可控、可操纵✁AIAgent? 谢谢 智能来,智索AI无限可能 智能未来,探索AI✁无限可能性