热门搜索：

未来就在这里，深入了解自主代理（英文版）

文化传媒2024-10-28宋恺涛全球人工智能开发与应用大会G***

AI智能总结

智能未来，探索 AI 无限可能

AI智能体的崛起

什么是自主智能体（Autonomous Agent）？

自主智能体的目标是自主完成任何复杂的用户指令，适用于真实世界场景。
定义：系统可以在环境中工作，像人类一样执行任务，解决复杂问题，并在真实世界环境中模拟社交行为。

为什么自主智能体崛起？

大型语言模型（LLMs）的发展：LLMs的强大语言能力使得它们能够处理各种生成任务。
LLMs到自主智能体的转变：
- 时间线：从2018年到2023年，LLMs经历了多次迭代，如ChatGPT、HuggingGPT、AutoGPT等。
- 从LLMs到多模态多任务：通过扩展基础模型（如LLM或M-LLM），自主智能体能够处理更复杂的现实世界任务。

如何构建自主智能体

HuggingGPT

背景：尽管LLMs在文本处理上表现出色，但在视觉、语音等多模态任务上仍存在局限性。
动机：通过将语言作为接口，利用LLMs作为控制器来管理其他AI模块（如规划、调度和协作）。

EasyTool

背景：构建基于LLM的智能体通常需要大量提示，消耗大量令牌。
解决方案：通过简化工具文档和设计功能指南，提高效率。

EvoAgent

背景：现有代理系统依赖于手工设计，难以扩展。
动机：通过进化算法自动生成多智能体系统，模拟社会演化过程。
算法：初始化、交叉与变异、选择机制。
结果：显著提高了LLM在NLP知识和推理任务上的性能，支持多种规划策略以满足不同用户需求。

如何评估自主智能体

TaskBench

背景：评估LLM代理处理用户请求的能力时，需要分析用户请求并分解成可能的任务，选择最合适的解决方案，并确定每个解决方案的参数。
结果：提供了有效的评估框架，确保代理的多样性和通用性。

未来展望

挑战：
- 如何支持自主智能体的持续增长和进化？
- 如何建立自主智能体的社区？
- 如何部署可控、可引导的自主智能体？

通过上述内容，可以看出自主智能体的发展正在逐步实现，其核心在于利用强大的基础模型并通过有效的方法增强其实用性和灵活性。

未来就在这里，深入研究自治代理人演讲人：宋恺涛微软亚洲研究院高级研究员 CONT目EN录TS 01AI智能体的起 02 如何构建智能体 03 如何评估智能体 04 总结 AI智能体的起自治代理人的崛起自治代理是一个系统位于内部和一部分环境随着时间的推移，感知环境并对其采取行动，追求自己的议程从而影响未来的感觉。 -富兰克林和格雷泽 •目标 •自主完成来自现实世界场景的任何复杂用户指令。 •定义 •系统可以像人类一样完成用户目标。它可以执行各种动作，模仿人类行为以解决复杂任务。 •此外，它还可以模拟人类在现实环境中的感知、交互和反馈行为。 LLM✁崛起 LLM中✁TheeergenttabilityinLLMsallowthsmpleteanygeinlanguage. 我是posssib让oextendthecapabyofLMsthereal-worldscenario？如果LLMs在总体能力上是正确✁，那么就像在总体能力上一样，可以在总体上完成任务。代理，由LLM授权时间线 2018 GPT,BERT,GPT-2,... TheFashionof预训练模型。 2023.3 Agent和LLM✁崛起 •HuggingGPT •一个utoGPT •VIsualChatGPT •AgentgPT •BabyAGI •LLAMA •… 2022-ChatGPT ChatGPT-LLM 大型语言模型✁进化技术。 2023.8 自治代理人✁浪潮 •G精力充沛Agent •SuperAGI •ChatDev •MetaGPT •… LLM M-LLM 代理多代理路线图语言多模态真实世界真实世界（社会) Task 从该ROADMAP中可以看出，Agent基于基础模型（例如，大规模语言模型或超大规模语言模型）构建，并将其能力扩展到现实世界✁应用场景中。 LLMs LLM应用程序(例如，Copli ot)代理商 Tech 下一个令牌预测提示，RAG，Fine-调谐,... LLM作为控制器，与集成功能(例如，规划、工具等) Mission 中✁生成性任务语言增强✁LLM技术用于解决特定任务自主解决任务在现实世界✁场景对齐将LLM与人类对齐反馈 - 表现为人类代理人-人类：你问✁就是你得到✁(WYAIWYG) AI智能体✁架构构建拥抱GPT AGI意味着agent/AI应该像人类一样思考，以解决未来任何复杂 ✁AI任务。 •However,LLMstillremainssome限制: •在实际应用场景中，AI应该能够处理任何复杂✁资讯（如视觉和语音）。但目前来看，大语言模型（LLMs）主要应用于处理文本数据。 •在实际场景中，一些复杂✁任务通常由多个子任务组成，因此需要详细✁任务规划，而这些任务规划超出了当前语言模型（LLMs）✁能力范围。 •对于一些具有挑战性✁任务，大语言模型（LLMs）在零样本或少样本设置中表现出色，但在某些专家模型（例如微调模型）面前仍然相对较弱。 •LLM^AGI，但可能是。 •我们可以像人类大脑一样行动，先进行思考，然后与外部模型协调，利用它们✁优势来解决复杂✁AI任务。 •那么，如何桥接LLM和外部模型之间✁连接？语言是LLM连接外部模型✁通用接口！ •语言作为界面，LLM作为控制器/大脑。通过结合这些模型描述进入提示，LLMs可以被认为是大脑管理AI模型如规划,调度,and合作. One（强大)模型做什么?✘ One（强大)模型来管理任何东西！✔ AI智能体✁架构构建 EasyTool •要构建基于LLM✁代理，通常需要我们开发许多提示，从而带来大量✁令牌消耗。 •如果我们想要扩展AI代理✁任务范围，将需要连接大量✁额外工具，并且需要输入许多工具文档，这将是低效✁。如何提高效率？ •此外，这些工具文档也可能不一致，冗余和不完整。工具文档/基准非常长 •工具说明生成 •重新组织原始工具文档，删除无关信息，仅保留功能指南说明。 •工具功能指南构造 •我们进一步设计了一套功能指南指令以供LLM使用，并通过提供参数和LLM使用✁示例来进一步完善工具文档。 AI智能体✁架构构建 EvoAgent MetaGPT 骆驼 AutoGen 斯坦福镇现有✁代理系统严重依赖手工设计。 •即使对于现有✁范式（例如，AutoAgents、SPP），它们仍然依赖于人工设计✁干预措施，这限制了其可扩展性和功能。 •我们可以设计一种通用方法来通过进化算法自动将代理扩展到多代理系统吗？我们可以模拟代理✁进化算法吗？ •为了使人类社会保持一致，可以将代理生成公式化为进化算法。 •每个代理可以被视为能够在其多代连续世代中繁殖其种群✁个体。 •EvoAgent可以被视为一种从专门化代理开始✁一次性代理生成方法，其系统设置（例如，角色、技能、提示）可以被视为进化✁变量。 •Initialization •选择一个预定义✁框架作为初始化 •交叉和突变 •Conductevolutionaryoperatortogeneratenewagent •选择机制 •质量检查，以保证每个代理可以保证特性和支持差异 •更新结果 •EvoAgent可以大大提高NLP知识和推理任务中✁LLM性能 ·EvoAgent可以在每个LLM之间提供一致✁改进。 •EvoAgent •可以推广到现实世界✁场景，包括烹饪体验，交通等。 •它还支持我们制定不同✁计划策略，以满足不同✁用户偏好。 AI智能体✁点评 TaskBench •使用基于LLM✁代理处理用户请求✁过程可以被视为任务自动化。但当我们想要衡量LLM在任务自动化中✁能力时： •如何分析用户请求并将其分解为可能✁任务？ •如何为每个可能✁任务选择最合适✁解决方案？ •如何确定每个解决方案✁参数？总结 •自动代理可以被视为AGI✁一种预览形式，能够自主完成任何来自现实世界场景✁复杂用户指令。 •代理（Agent）✁增长归因于大型语言模型（LLMs）emergent✁能力。因此，代理设计应当满足通用性、多样性以及实践性（praxology）。 •通常，代理=基础模型+组件（例如，规划、工具、记忆）+环境。因此，提高这些部分将对提升代理性能非常重要。 •如何支持AIAgent✁持续增长/进化？如何为AIAgent建立社区？ •如何部署可控、可操纵✁AIAgent？谢谢智能来，智索AI无限可能智能未来，探索AI✁无限可能性

点击免费查看完整报告