您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[头豹研究院]:2024年中国AI Agent行业研究:智能体落地千行百业,引领智能化革命的新引擎(摘要版) - 发现报告
当前位置:首页/行业研究/报告详情/

2024年中国AI Agent行业研究:智能体落地千行百业,引领智能化革命的新引擎(摘要版)

信息技术2024-09-05张俊雅头豹研究院机构上传
2024年中国AI Agent行业研究:智能体落地千行百业,引领智能化革命的新引擎(摘要版)

关于头豹 报告作者 姓名:张俊雅 头豹深耕行企研究6年,凭借丰富的内容生产、平台运营和知识管理经验,基于人工智能、大模型、云计算等先进数字技术,构建了业内领先的全产业覆盖、百万级原创研究内容数据库,首创全开源、多方协同、可拓展的智慧行研平台——“脑力擎KnowlengineTM”知识管理与研究辅助KaaS系统,并通过“AI推理+AI搜索”双引擎辅助分析师提升工作效能,加深行研精度,助力行业实现数字化转型升级,赋能数字中国建设。 职位:TMT行业分析师 Email:jacob.zhang@leadleo.com 头豹科创网(www.leadleo.com)拥有20万+专业用户,全行业赛道覆盖及相关研究报告产出数百万原创数据元素,每年数千场直播及视频内容,用户覆盖了超过70%的投融资机构、金融机构和资本市场服务机构。近年来,头豹研报在资本市场的影响力逐年提升。据不完全统计,已有上百家拟上市及上市公司在其信披材料中大量引用头豹数据及观点。头豹精选报告被全球著名的财经资讯平台路孚特(Refinitiv)广泛收录,帮助中国企业获得国内外投资机构重点关注,吸引投资,赋能企业发展。 业务合作 定制报告/词条 会员账号 行业研究| 2024/06 中国:AIAgent系列 摘要 AIAgent(人工智能体)是一种能够感知环境、进行决策和执行动作的智能实体。不同于传统的人工智能,AI Agent具备通过独立思考、调用工具去逐步完成给定目标的能力。AI Agent和大模型的区别在于,大模型与人类之间的交互是基于prompt实现的,用户prompt是否清晰明确会影响大模型回答的效果。而AI Agent的工作仅需给定一个目标,它就能够针对目标独立思考并做出行动。 AIAgent在toB端的应用前景更加广阔 AIAgent的应用可分为消费级(toC)和企业级(toB),消费级强调应用的自由度,而企业级强调应用的专业性。AI Agent消费级应用的核心价值在于为个人用户提升工作效率、提供情绪价值,企业级应用的核心价值则在于为企业降本增效,提升客户粘性,同时辅助企业决策。相较于消费级应用,企业级应用面临更加复杂的业务需求,有更明确的业务场景、业务逻辑以及更多行业数据及其行业知识的积累。 目前,海外约有100+项目正致力于将AI智能体商业化。海外主要基于GPT与开源Agent框架打造Agent项目,主流的AI Agent项目及产品有Auto-GPT、AgentGPT、BabyAGI、Jarvis、西部世界小镇等 ; 国内也陆续推出多款AI Agent产品,多基于国产大模型+开源Agent框架打造。主流产品包括阿里云的ModelScopeGPT、实在智能的TARS-RPA-Agent、联汇科技的OmBot欧姆智能体、澜起科技的AskXbot等。 AIAgent应用场景广泛且多样,其正在各行业领域加速渗透 从目前已推出的AI Agent架构与产品来看,AIAgent已逐步渗透至金融、电商零售、教育、医疗、制造、交通、媒体娱乐、能源、物流、政务等行业领域。其中,AI Agent在金融行业的应用成熟度、数据可获取性、行业需求度和市场潜在规模均最高。 行业研究| 2024/06 中国:AIAgent系列 AI Agent行业综述——定义及基础架构 AIAgent(人工智能体)是一种能够感知环境、进行决策和执行动作的智能实体。不同于传统的人工智能,AIAgent具备通过独立思考、调用工具去逐步完成给定目标的能力 AIAgent系统架构 短期记忆 长期记忆 日历() 记忆 计算器() 反射 工具 智能体 规划 代码解释器() 自我反思思维链 搜索() 行动 更多… 交互协作 子目标拆解 智能体 智能体 AIAgent(人工智能体)是一种能够感知环境、进行决策和执行动作的智能实体。不同于传统的人工智能,AIAgent具备通过独立思考、调用工具去逐步完成给定目标的能力。AI Agent和大模型的区别在于,大模型与人类之间的交互是基于prompt实现的,用户prompt是否清晰明确会影响大模型回答的效果。而AI Agent的工作仅需给定一个目标,它就能够针对目标独立思考并做出行动。 一个基于大模型的AI Agent系统可以拆分为LLM(大模型)、记忆(Memory)、任务(Planning)以及工具使用(Tool)的集合。在LLM为基础的AI Agent系统中,大模型为AI Agent系统的大脑负责计算,并需要其他组件进行辅助。 规划(Planning):①对需要更多步骤的复杂任务,AI Agent能够调用LLM通过思维链能力进行任务分解,在AI Agent架构中,任务的分解和规划是基于大模型的能力来实现的,大模型的思维链能力通过提示模型逐步思考,将大型任务分解为较小的、可管理的子目标,以便高效的处理复杂任务;②通过反思和自省框架,AI Agent可以不断提升任务规划能力,AI Agent可以对过去的行为进行自我批评和反省,从错误中吸取经验教训,并对未来的行动进行分析、总结提炼和完善,从而提高最终结果的质量。 记忆(Memory):①对AI Agent智能体系统的所有输入会成为系统的短期记忆,所有上下文学习都是依赖模型的短期记忆进行的。短期记忆受到有限上下文窗口长度的限制,不同模型的上下文窗口限制不同;②AI Agent在完成目标时,需要查询的外部向量数据库成为系统的长期记忆。长期记忆使得AI Agent能够长期保存和调用无限信息的能力。外部的向量数据库可通过快速检索进行访问。AIAgent主要通过长期记忆完成很多复杂任务,如阅读PDF、知识库等。 工具(Tools):①AI Agent能够使用外部工具API拓展模型能力,以获取大模型以外的能力和信息,如预定日程、设置代办、查询数据等;②类GPT等大模型也更新了插件的功能,能够调用插件访问最新信息或者特定数据源,但需要用户针对提问问题提前选择需要使用的插件,无法做到自然地回答问题。AI Agent可自动调用工具使用,根据规划获取的每一步任务判断是否需要调用外部工具来完成该任务,并获取工具API接口返回的信息给到大模型进行下一步任务。 AI Agent行业综述——人机协同模式差异 人类与AI协同的三种模式包括嵌入模式(Embedding)、副驾驶模式(Copilot)和智能体模式(Agent),相较于前两种模式,智能体模式更为高效,或将成为未来人机协同的主要模式 人类与AI协同的三种模式 Embedding模式 Copilot模式 Agent模式 人类 AI 人类 AI 人类 AI 人类完成绝大部分工作 人类和AI协作工作 AI完成绝大部分工作 人类设立任务目标 人类设立任务目标 AI全权代理 其中某(几)个流程AI完成初稿 设立目标 任务拆分工具选择进度控制 其中某(几)个任务AI提供信息或建议 提供资源 监督结果 人类修改调整确认 人类自主结束工作 AI自主结束工作 人类自主结束工作 基于大模型的Agent不仅可以让每个人都有增强能力的专属智能助理,还将改变人机协同的模式。带来更加广泛的人机融合。生成式AI带来的人机协同,将会呈现三种模式:嵌入模式(Embedding)、副驾驶模式(Copilot)和智能体模式(Agent)。相较于嵌入模式、副驾驶模式,智能体模式的人机协同模式更为高效,或将成为未来人机协同的主要模式 嵌入(Embedding)模式:用户通过与AI进行语言交流,使用提示词来设定目标,然后AI协助用户完成这些目标,比如普通用户向生成式AI输入提示词创作小说、音乐作品、3D内容等。在这种模式下,AI的作用相当于执行命令的工具,而人类担任决策者和指挥者的角色。 副驾驶(Copilot)模式:在这种模式下,人类和AI更像是合作伙伴,共同参与到工作流程中,各自发挥作用。AI介入到工作流程中,从提供建议到协助完成流程的各个阶段。例如,在软件开发中,AI可以为程序员编写代码、检测错误或优化性能提供帮助。人类和AI在这个过程中共同工作,互补彼此的能力。AI更像是一个知识丰富的合作伙伴,而非单纯的工具。 智能体(Agent)模式:人类设定目标和提供必要的资源(如计算能力),然后AI独立地承担大部分工作,最后人类监督进程以及评估最终结果。这种模式下,AI充分体现了智能体的互动性、自主性和适应性特征,接近于独立的行动者,而人类则更多地扮演监督者和评估者的角色。 AI Agent行业综述——特征及分类 AIAgent的基本特征在于其自主性、交互性、反应性和适应性;在类别上,AIAgent目前可分为自主智能体(AutonomousAgent)和生成智能体(GenerativeAgent) AIAgent的基本特征 自主性 自主性使得智能体能够在没有人类干预的情况下自主决策和行动。例如,在智能家居系统中,智能体可以根据室内温度和湿度自动调节空调和加湿器,以提供最舒适的居住环境。 交互性 交互性使得智能体能够与其他智能体或人类进行交流和合作。例如,在自动驾驶汽车中,智能体需要与交通信号灯、其他车辆和行人进行交互,以确保安全行驶。 反应性 反应性是指智能体能够对外部刺激做出及时的反应。例如,在机器人领域中,智能体需要能够感知环境的变化,并做出相应的动作来适应。 适应性 适应性使得智能体能够根据经验调整自身的行为。通过不断学习和积累经验,智能体可以逐渐优化自身的决策和行动策略,以适应不同的环境和任务。例如在智能推荐系统中,智能体根据用户的反馈和行为数据不断调整推荐策略,以提高推荐的准确性和用户满意度。 AIAgent分类 自主智能体 生成智能体 (GenerativeAgent)生成智能体,如斯坦福和Google的研究者共同创建的西部世界小镇或者《西部世界》中的人形机器人,它们在同一环境中生活,拥有自己的记忆和目标,不仅与人类交往,还会和其他机器人互动。 (Autonomous Agent)自主智能体,如Auto-GPT,能够根据人们通过自然语言提出的需求,自动执行任务并实现预期结果。在这种合作模式下,自主智能体主要是为人类服务,更像是一个高效的工具。 AI Agent类型 当前应用 当前应用 AutoGPT、ChatGPT+插件、adept、MetaGPT等 Pi、Smallville小镇、Voyager、GITM等 智能体的基本特征在于其自主性、交互性、反应性和适应性,这些特征使得智能体能够在不同的环境中独立行动,与其他智能体或人类进行交互,对外部刺激做出反应,并根据经验调整自身的行为。 在类别上,智能体目前可分为自主智能体(AutonomousAgent)和生成智能体(GenerativeAgent)。 AI Agent行业综述——发展历程及目标 AIAgent的最终目标是通向AGI,其发展经历了符号智能体、反应型智能体、基于强化学习的智能体、具有迁移学习和元学习功能的智能体四大发展阶段,现在已经跨入基于大型语言模型的智能体阶段 AIAgent发展历程及远景目标 基于大模型 基于深度学习 基于统计学习 基于符号规则 AGI(人工通用智能) 反应型智能体 关注智能体与其环境之间的交互,强调快速和实时响应,缺乏复杂决策和规划能力 符号型智能体 采用逻辑规则和符号表示来封装知识和促进推理过程。如1980年前后,出现的医学诊断专家系统、模拟心理治疗等 基于强化学习的智能体 关注如何让智能体通过与环境的交互进行学习 基于大语言模型的智能体 LLM带来了深度学习新范式,思维链和强大的自然语言理解能力有望让Agent具备强大的学习能力和迁移能力,从而让创建广泛应用且实用的Agent成为可能 基于迁移学习和元学习的智能体 使智能体从少量样本中迅速推理出执行任务的最优策略 随着大模型的不断发展,业内对大模