您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[麦肯锡]:为什么代理是生成式人工智能的下一个前沿(英) - 发现报告
当前位置:首页/行业研究/报告详情/

为什么代理是生成式人工智能的下一个前沿(英)

信息技术2024-07-01麦肯锡�***
为什么代理是生成式人工智能的下一个前沿(英)

麦肯锡数字实践 为什么代理人是生成AI的下一个前沿 通过从信息转变为行动-认为虚拟同事能够完成复杂的工作流程-该技术有望带来新一波的生产力和创新。 由LareinaYee,MichaelChui和RogerRoberts与StephenXu 2024年7月 在过去的几年里,世界对生成AI(generativeAI)释放的能力和可能性感到惊讶。基础模型,例如大型语言模型(LLM),可以实现令人印象深刻的壮举,在文本,音频 ,图像和视频等多种媒介中提取见解并生成内容。但是 genAI的下一阶段可能更具变革性。 我们正在开始从基于知识的,由AI驱动的工具演变-例如,可以回答问题的聊天机器人 并生成内容-到一代AI启用的“代理”,这些代理使用基础模型在数字世界中执行复杂的多步骤工作流程。简而言之,该技术正在从思想转变为行动。 从广义上讲,“agentic”系统是指可以在动态世界中独立交互的数字系统。虽然这些软件系统的版本已经存在多年,但 geAI的自然语言功能揭示了新的可能性,使系统能够计划他们的行动,使用在线工具来完成这些任务,与其他代理和人员合作,并学习提高他们的表现。GeAI代理最终可以充当熟练的虚拟同事,以无缝和自然的方式与人类合作。例如,虚拟助手可以计划和预订复杂的个性化旅行行程,处理跨多个旅行平台的物流。使用日常语言,工程师可以向程序员代理描述新的软件功能,然后程序员代理将编码,测试,迭代和部署它帮助创建的工具。 传统上,机构系统很难实现,需要费力的、基于规则的编程或机器学习模型的高度特定培训。GenAI改变了这一点。 当使用基础模型(已经在极其庞大和多样的非结构化数据集上训练)而不是预定义的规则来构建代理系统时,它们有可能适应 todifferentscenariointhesamewaythatLLMcanresponseintellightlytopromptsonwhichtheyhavenotbeenexplicitlytrained.Furthermore,usingnaturallanguageratherthanprogrammingcode, 人类用户可以指导一个generAI-enabled 代理系统来完成复杂的工作流。 然后,多代理系统可以将此工作流程解释并组织为可操作的任务,将工作分配给专门的代理,使用数字工具生态系统执行这些细化的任务,并与其他代理和人类协作以迭代地提高其操作质量。 在本文中,我们探讨了使用genAI代理所带来的机会 。尽管该技术仍处于起步阶段,需要进一步的技术开发才能准备好进行业务部署,但它很快 吸引注意力。仅在过去的一年里,谷歌、微软、OpeAI和其他公司就投资了软件库和框架来支持代理功能。LLM支持的应用程序,如MicrosoftCopilot,AmazoQ和Google即将推出的ProjectAstra,正在从基于知识的转变为基于行动的转变。诸如Adept,crewAI和Imbe之类的公司和研究实验室也在开发基于代理的模型和多代理系统。考虑到一代AI的发展速度,代理可能会像今天的聊天机器人一样司空见惯。 代理商能为企业带来什么价值? 代理商可以释放的价值来自他们的潜力,即自动化大量复杂用例的潜力,这些复杂用例的特征是输入和输出高度可变-这些用例历来很难以成本或时间高效的方式解决。例如,像商务旅行这样简单的事情可能涉及许多可能的行程,包括不同的航空公司和航班,而不是 提到酒店奖励计划、餐厅预订和非工作时间活动,所有这些都必须在不同的在线平台上处理。虽然已经努力使这一过程的部分自动化,但其中大部分仍然必须手动完成。这在很大程度上是因为潜在输入和输出的广泛变化使得该过程过于复杂、昂贵或耗时而无法自动化。 支持AI的Gen代理可以通过三种重要方式简化复杂和开放式用例的自动化: —代理可以管理多重性。许多业务用例和流程的特点是线性工作流,具有清晰的开始和一系列导致特定解决方案或结果的步骤。这种相对简单性使得它们在基于规则的系统中易于编码和自动化。但是基于规则的系统通常表现出 “脆性”-也就是说,当面对明确规则的设计者没有考虑到的情况时,它们会崩溃。例如,许多工作流程的可预测性要低得多,其特征是意外的曲折和一系列可能的结果;这些工作流程需要特殊的处理和细微差别的判断,这使得基于规则的自动化具有挑战性。但是GeneAI代理系统,因为它们基于基础模型,有可能处理给定用例的各种不太可能的情况,实时适应执行完成流程所需的专门任务。 —代理系统可以用自然语言指导。当前,要自动化用例,首先必须将其分解为一系列可以编码的规则和步骤。这些步骤通常被转换为计算机代码并集成到软件系统中,这是一个通常昂贵且费力的过程,需要大量的技术专长 。由于代理系统使用自然语言作为一种指令形式,即使是复杂的工作流程也可能 更快速,更轻松地进行编码。而且,该过程可能由非技术员工而不是软件工程师完成。这使得更容易集成主题专业知识,授予更广泛的genAI和AI工具访问权限,并简化技术和非技术团队之间的协作。 —代理可以使用现有的软件工具和平台。除了分析和生成知识外,代理系统还可以使用工具并在更广泛的数字生态系统中进行通信。例如,可以指导代理使用软件应用程序(例如绘图和图表工具),在网络上搜索信息,收集和编译人类反馈,甚至利用其他基础模型。数字工具的使用既是一种 定义代理人的特征(这是他们在世界上行动的一种方式 ),也是他们的一代人工智能能力可以独特地发挥作用的一种方式。基础模型可以学习如何与工具交互,无论是通过自然语言还是其他接口。如果没有基础模型 ,这些功能将需要大量的手动工作来集成系统(例如 ,使用提取,转换和加载工具)或繁琐的手动工作来整理来自不同软件系统的输出。 基于AI的代理如何工作 代理可以支持跨行业和业务功能的高复杂性用例,特别是对于涉及耗时任务或需要各种专门类型的定性和定量分析的工作流。代理通过递归地分解复杂的工作流并跨专门的指令和数据源执行子任务来达到预期目标。该过程通常遵循这四个。 步骤(附件1): 1.用户提供说明:用户通过提供自然语言提示与AI系统进行交互,就像指示受信任的员工一样。系统识别预期的用例,要求用户在需要时进行额外的澄清。 2.代理系统计划、分配和执行工作:代理系统将提示处理为工作流,将其分解为任务和子任务,由经理子代理分配给其他专门的子代理。这些子代理配备了必要的领域知识和工具,利用先前的“经验”并编纂了领域专业知识,相互协调并使用组织数据和系统来执行这些分配。 3.代理系统迭代地改进输出:在整个过程中,代理可以请求额外的用户输入以确保准确性和相关性,该过程可以结束于代理向用户提供最终输出,迭代用户共享的任何反馈。 附件1 由生成AI启用的代理很快就可以充当高效的虚拟同事。 从提示到输出,说明代理 系统如何执行工作流 代理系统 经理代理 外部系统: 代理与数据库和系统(组织和外部数据)交互以完成任务。 分析员检查器规划师代理代理代理 专业代理商 开始1 2 3 4 结束 使用自然语言,用户提示生成AI代理系统完成任务。 代理系统解释提示并建立工作计划。经理代理将项目细分为分配给专业代理的任务;他们从多个来源收集和分析数据 ,并相互协作以执行各自的任务。 代理团队与用户共享草稿输出。 代理团队接收用户反馈,然后迭代并相应地改进输出。 麦肯锡公司 4.代理执行操作:代理在世界范围内执行任何必要的操作以完全完成用户请求的任务。 可能的艺术:三个潜在的用例 这些系统对企业意味着什么?以下三个假设 用例提供了在不远的将来可能发生的事情的一瞥。 用例1:贷款承销 金融机构准备信用风险备忘录,以评估向借款人提供信贷或贷款的风险。该过程包括汇编、分析和审查与借款人、贷款类型和其他因素有关的各种形式的信息。鉴于信用风险情景和分析的多样性 需要,这往往是一个耗时和高度协作的努力,要求关系经理与借款人,利益相关者和信贷分析师进行专门的分析,然后提交给信贷经理进行审查和额外的专业知识。 潜在的基于代理的解决方案:一个代理系统-包括多个代理 ,每个代理都承担一个专门的、基于任务的角色-可能有可能 被设计为处理广泛的信用风险场景。人类用户将通过使用自然语言来启动该过程,以提供具有特定规则,标准和条件的任务的高级工作计划。然后,该代理团队将工作分解为可执行的子任务。 例如,一个代理可以充当关系经理来处理通信 在借款人和金融机构之间。执行代理人可以编制必要的文件,并将其转发给财务分析师代理人,例如,从现金流量表中检查债务并计算相关的财务比率,然后由评论家代理人进行审查,以识别差异和错误并提供反馈。这个分解,分析,完善和审查的过程将被重复,直到。最终信用备忘录完成(附件2)。 与更简单的一代AI架构不同,代理可以产生高质量的内容,从而将审核周期减少20%至60%。代理还能够遍历多个系统并理解从多个来源提取的数据。最后,代理可以展示他们的工作:信用分析师可以快速钻取 输入任何生成的文本或数字,访问完整的任务链并使用数据源生成生成的见解。这有助于快速验证输出。 用例2:代码文档和现代化 大型企业的传统软件应用程序和系统通常会带来安全风险,并可能减慢业务创新的步伐。但是 对这些系统进行现代化可能是复杂的、昂贵的和耗时的,需要工程师审查和理解数百万行的旧代码库和业务逻辑的手动文档,然后将这些逻辑转换为更新的代码库,并将其与其他系统集成。 潜在的基于代理的解决方案:AI代理商有显着简化这一过程的潜力。 可以将专门的代理部署为遗留软件专家,分析旧代码和 记录和翻译各种代码段。同时,质量保证代理可以批评此文档并生成测试用例,帮助AI系统迭代地改进其输出并确保其准确性和遵守 附件2 生成的AI代理有可能通过提高生产力来改变我们的工作方式。 说明性用例:信用风险备忘录 金融机构通常花费1-4周的时间来创建信用风险备忘录。 当前流程: 关系经理(RM)从15多个来源收集有关借款人,贷款类型和其他因素的数据。 RM和信贷分析师合作分析数据。 信用分析师通常花费20多个小时来撰写备忘录。 RM审查备忘录并提供反馈 ;信贷分析师写道纳入反馈的新草案。 开始结束 开始结束123 生成AI (generAI)代理商可以使用以下步骤将创建信用风险备忘录的时间减少20-60%: RM提示genAI代理系统,并提供制作备忘录所需的相关材料。 代理将项目细分为分配给专业代理的任务,这些任务从多个来源收集和分析数据,然后协作生成备忘录草案。 RM和信贷分析师审查备忘录并给出反馈;代理人将反馈纳入最终备忘录。 麦肯锡公司 同时,该过程的可重复性质可能会产生飞轮效应,其中代理框架的组件被重新用于整个组织中的其他软件迁移,从而显着提高了生产率并降低了软件开发的总成本。 用例3:在线营销活动创建设计、启动和运行在线营销活动往往涉及一系列 不同的软件工具、应用程序和平台。在线营销活动的工作流程非常复杂。商业目标和市场趋势必须转化为创造性的运动想法。必须为不同的细分市场和地理位置创建和定制书面和视觉材料。必须使用跨各种平台的用户组对活动进行测试。为了完成这些任务,营销团队经常使用不同形式的软件,并且必须将输出从一个工具转移到另一个工具,这通常是乏味和耗时的。 潜在的基于代理的解决方案:代理可以帮助连接这个数字营销生态系统。例如,营销人员可以用自然语言描述目标用户、初始想法、预期渠道和其他参数。然后,代理系统-在营销的帮助下 专业人员-将帮助开发,测试和迭代不同的运动想法。数字营销策略代理可以利用在线调查,客户关系管理解决方案的分析以及其他市场研究平台,旨在使用多式联运基础模型收集制定策略的见解。然后,内容营销,文案撰写和设计的代理商可以构建量身定制的内容,评估人员将对其进行品牌调整。这些代理商将协作以迭代和完善输出,并朝着优化活动影响同时将品牌风险降至最低的方法保持一致。 企业领导