您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国信证券]:人工智能行业专题:大厂Agent来临,MCP拓宽应用边界 - 发现报告

人工智能行业专题:大厂Agent来临,MCP拓宽应用边界

信息技术2025-04-24熊莉国信证券
AI智能总结
查看更多
人工智能行业专题:大厂Agent来临,MCP拓宽应用边界

行业研究·行业专题 计算机·人工智能 投资评级:优于大市(维持评级) 证券分析师:熊莉021-61761067xiongli1@guosen.com.cnS0980519030002 摘要 Ø字节跳动:发布通用Agent,掀开大厂竞赛帷幕。4月18日晚间,字节跳动扣子空间开启内测,定位通用Agent,平台上用户可以选择精通各项技能的通用实习生,也可以选择行业的领域专家,通过与AI的互动完成工作任务。扣子空间通过支持添加MCP扩展,AI Agent能力边界被进一步扩展,接下来会有更多插件接入,MCP有望成为AI时代的HTTP协议。字节此举拉开了大厂布局通用Agent的序幕,阿里、腾讯等公司有望迅速推进,相关生态有望加速扩张。 Ø智谱:全栈自研,开源推动生态。3月31日,智谱在中关村论坛上正式发布AutoGLM沉思,本次全新智能体不仅具备深度研究能力,还能实现实际操作。AutoGLM沉思利用了智谱自主研发的全栈大模型技术,在多个测试环境中取得了SOTA成绩,展现了卓越的性能。当前核心模型逐步开源,推动相关生态进一步扩展,并快速催化相关应用场景。 ØGenspark:整合多AI模型提供准确响应。美国时间4月2日,Genspark超级智能体发布,官方宣称其是一个综合性的AI助手,可以协调多个AI工具高效地执行各项任务。Genspark采用整合多AI模型的混合代理(MoA)系统,包含80多个工具集和10多个高级数据集,每个模型都专门用于特定任务,提供更准确、可靠的响应。 Ø投资建议:Agent发展打开了人机协同全新范式,将为AI应用提供新的发展思路。未来模型能力将持续提升、各领域Agent将成为模型触达终端用户的载体,持续看好AI应用后续发展。 Ø风险提示:AI应用落地不及预期、市场需求不及预期、行业竞争加剧、宏观经济波动、新技术研发不及预等。 目录 字节跳动:发布通用Agent,掀开大厂竞赛帷幕01智谱:全栈自研,开源推动生态02Genspark:整合多AI模型提供准确响应03投资建议及风险提示04 字节发布通用Agent扣子空间 •4月18日晚间,字节跳动扣子空间开启内测,定位通用Agent。与其他类似产品如manus一样,扣子空间采用了邀请码制。平台上用户可以选择精通各项技能的通用实习生,也可以选择行业的领域专家,通过与AI的互动完成工作任务。 •据官方介绍,扣子空间主要有以下特点:1)从回答问题,到解决问题全线打通:自动分析需求,拆解为多个子任务;自主调用工具(浏览器、代码编辑器等),执行任务;输出完整的结果报告,例如网页、PPT、飞书文档等。2)拥有专家Agent生态:华泰A股观察助手可以为用户进行每日早报生成、针对股票分析问题、答疑解惑;用户研究专家可以协助进行用研资料深度分析,获取更多用户洞察。3)探索/规划双模式,人机协同完成高难度任务:用户如果想一步到位输出,可以选择探索模式、如果想亲自把控每个步骤,可以选择规划模式。4)MCP扩展集成,拓展Agent能力边界:首批官方支持飞书多维表格、高德地图、图像工具、语音合成等MCP;即将支持扣子开发平台发布MCP至扣子空间。 资料来源:公司官网,国信证券经济研究所整理 MCP扩展AI能力边界 •通过支持添加MCP扩展,AI Agent能力边界被进一步扩展,接下来会有更多插件接入。MCP(Model Context Protocol)是一个开放标准协议,旨在标准化应用程序向大型语言模型提供上下文信息的方式。通过集成MCP扩展,Agent可以访问和利用各种外部工具和服务,丰富了Agent的功能范围,使其能够执行更复杂的任务。同时,MCP提供了一个标准化的接口,使得不同的工具和服务可以即插即用。这意味着Agent可以根据具体需求快速接入新的工具或数据源,无需为每个新集成开发特定的API或适配器,对于扣子空间的可用性以及生态构建均有显著推动作用。 •国内大厂纷纷布局MCP,AI能力边界持续拓展。4月9日,百度智能云率先宣布千帆大模型平台接入集成MCP。4月16日,蚂蚁智能体平台百宝箱推出了MCP专区,全面支持各类MCP服务的部署和调用。4月18日,腾讯全球数字生态大会成都峰会开幕,腾讯云智能区域解决方案总监王伟宣布,腾讯云大模型知识引擎已接入MCP,用户可调用平台精选或自定义MCP插件搭建应用。MCP有望成为AI时代的HTTP协议,可大幅提效AI应用开发、加速生态扩展。 扣子空间有望推动生态加速扩张 •实际使用下来,扣子空间主要有以下优点:1)内容全面,输出文档能力优秀,每一步任务均可溯源,相关的代码也可供用户下载,人机协同能力较竞品明显提高,从而提高可用性。2)支持多任务同时进行,新建一个任务,返回主页面再建一个,依然可以同步运行,提高了多任务场景下的工作效果。3)分为专家模型和通用模型两种,专家模型集中在专业领域的任务,实际使用体验优秀,输出结果深度,未来随着生态共建规模扩大,更多专家模型上线后,一方面可有效减少模型在专业领域的幻觉,另一方面可以提升用户的付费意愿,实现更高的收入转化。4)MCP扩展集成,目前已上线墨迹天气、高德地图、Github等主流应用,用户可根据实际需求选择扩展组件,解决模型实际应用中调用数据的问题,也为未来更多应用接入生态提供了入口。 •字节跳动发布扣子空间,拉开了大厂布局通用Agent的序幕,阿里、腾讯等公司有望迅速推进,相关生态有望加速扩张。 目录 字节跳动:发布通用Agent,掀开大厂竞赛帷幕01智谱:全栈自研,开源推动生态02Genspark:整合多AI模型提供准确响应03投资建议及风险提示04 智谱发布AutoGLM沉思 •3月31日,智谱在中关村论坛上正式发布AutoGLM沉思,本次全新智能体不仅具备深度研究能力(Deep Research),还能实现实际操作(Operator)。智谱将AutoGLM沉思定位为能探究开放式问题,并根据结果执行操作的自主智能体(AI Agent),能够模拟人类的思维过程,完成从数据检索、分析到生成报告。 •据智谱公司介绍,AutoGLM沉思的技术演进历经多个关键阶段,从GLM-4基座模型出发,经由GLM-Z1推理模型,进化至GLM-Z1-Rumination沉思模型,最终完成AutoGLM模型。其中,核心链路的技术与32B/9B GLM模型于4月15日全面开源。 •AutoGLM沉思核心在于三大能力:深度思考、感知世界和工具使用,不仅能模拟人类在面对复杂问题时的推理与决策过程,还能获取并理解环境信息,更具备调用和操作工具以完成复杂任务的能力。AutoGLM沉思以智谱新推出的沉思模型为基础,可通过强化学习让模型学会自我批评、反思、沉思,并通过更长的深度思考时间换取更优的效果。 资料来源:公司官网,国信证券经济研究所整理 AutoGLM沉思基于自主研发技术 •AutoGLM沉思利用了智谱自主研发的全栈大模型技术,该技术融合了GLM-4的通用能力、GLM-Z1的反思能力、GLM-Z1-Rumination的沉思能力以及AutoGLM的自动执行能力。其中,新版基座模型GLM-4-Air-0414以320亿参数量比肩国内外主流大模型,加强了工具调用、联网搜索和代码等智能体任务上的能力。新版推理模型GLM-Z1-Air在性能上可与DeepSeek-R1媲美,且在推理速度上提升了8倍,成本降低至1/30,进一步解放了开发者在硬件方面的限制。 •在斯坦福大模型中心选定的智能体基准评测Agent Bench上,AutoGLM系列模型在多个测试环境中取得了SOTA成绩,展现了卓越的性能。特别是在Phone Use和Browser Use基准测试中,AutoGLM-Phone和AutoGLM-Web均超越了OpenAI GPT-4o和Anthropic Claude-3.5-Sonnet等顶尖模型。 •在实际使用中,AutoGLM沉思能够回应开放式的复杂问题,通过同时进行推理和搜索,浏览数十至上百个网页,总结出调理清晰的长文报告,并提供所有引用来源。目前,AutoGLM沉思已在智谱清言PC客户端上线,此次发布的为preview版本,核心支持research场景,用户可以免费不限量体验。在未来两周,智谱还将进一步扩展更多智能体执行能力,包括推出“虚拟机”版本。 AutoGLM沉思开源推动应用场景 •总结来看,AutoGLM沉思主要有以下进步:1)AutoGLM沉思在Deep Reseach的基础上,叠加了AutoGLM操作电脑浏览器的环境交互能力,有效促进了模型思考的宽度和深度,自然输出的内容更全面。同时,作为免费开放的AI Agent,AutoGLM沉思降低了AI技术的使用门槛,让更多人能够体验和使用先进的AI技术,将促进AI技术的进一步普及;2)AutoGLM沉思的核心模型(如GLM-Z1-Air、GLM-Z1-Rumination)将于后续逐步开源,各企业可以免费集成相关功能,推动相关生态进一步扩展,并快速催化相关应用场景;3)与Manus相比,AutoGLM沉思完全免费使用,无需邀请码,无需排队,能够操作知乎、B站、公众号、小红书等多个平台,模拟人类收集信息的完整流程。而Manus主要专注于封装专业工作流,但工作流不支持中途打断,若执行中发现智能体执行方向有误,只能等执行结束后才能调整,因此AutoGLM沉思更为灵活、高效且易于访问;4)AutoGLM沉思目前没有明确的任务限制,可以同时运行多个任务,ManusStarter只能同时运行2个任务,Pro版可以运行15个任务,在使用表现方面具优势。同时,AutoGLM沉思基础模型完全自主研发,从基模到推理模型再到应用层完全自研可控,而Manus采用Multiple Agent架构,依赖外部API,限制了系统对特定功能进行修改或优化时的灵活性,更新受制于API提供商的支持程度和更新速度,且运行成本更高。AutoGLM沉思通过自主研发具备了更高的灵活性、控制力和成本效益等优势。 资料来源:公司官网,国信证券经济研究所整理 目录 字节跳动:发布通用Agent,掀开大厂竞赛帷幕01智谱:全栈自研,开源推动生态02Genspark:整合多AI模型提供准确响应03投资建议及风险提示04 Genspark智能体多项测试成绩领先 •美国时间4月2日,原百度副总裁、原小度科技CEO、MainFunc联合创始人兼CEO景鲲通过社交平台发布了一款名为Genspark的超级智能体。Genspark宣称Genspark Super Agent是一个综合性的AI助手(AI Search+Browse+Agents),可以协调多个AI工具高效地执行各项任务,在GAIA Benchmark(通用人工智能基准测试)中,Genspark在三个不同级别(Level 1、Level 2、Level 3)测试中的表现都超越了Manus、OpenAI Deep Research等产品。 •据其官方介绍,Genspark采用的是整合多AI模型的混合代理(MoA)系统,包含了80多个工具集和10多个高级数据集。Genspark背后的模型数量目前多达9个,除了Claude,还有谷歌、OpenAI、DeepSeek等主流模型,此外还有文本到图像生成模型Ideogram、Recraft、FLUX、DALL等,视频生成模型Kling、PixVerse、Lumalabs Ray等,以及用于机器翻译的大型语言模型DeepL。与依托单一模型的AIagent产品不同,MoA系统能够汇总和优化来自多个高级模型的响应,每个模型都专门用于特定任务,提供更准确、可靠的响应。 资料来源:公司官网,国信证券经济研究所整理 资料来源:公司官网,国信证券经济研究所整理 手机端应用拓展使用场景 •Genspark在3月就上线了iOS应用程序,其定位是超级AI应用,集AI搜索、具有广告拦截功能的快速浏览器以及AI代理功能于一体。Genspark平台为新注册用户提