您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[开源证券]:计算机行业深度报告:AI Agent拐点已至,2B+2C星辰大海 - 发现报告

计算机行业深度报告:AI Agent拐点已至,2B+2C星辰大海

信息技术2024-12-24陈宝健、李海强开源证券等***
AI智能总结
查看更多
计算机行业深度报告:AI Agent拐点已至,2B+2C星辰大海

2025年有望成为AI Agent商业化应用元年 AI Agent为以大语言模型(LLM)为驱动,具有自主理解、感知、规划、记忆和使用工具的能力,能自动执行复杂任务的系统。不同于传统人工智能,AI Agent具备通过独立思考、调用工具逐步完成给定目标的能力。我们看好AI Agent应用将在2025年多点开花,其中AI Agent有望在B端率先商业化,电商、营销、CRM、金融、法律等场景加速落地。伴随国内外巨头大模型持续迭代,C端或有望迎来杀手级应用。 C端:AI Agent初显峥嵘,静待杀手级应用 11月,智谱AI发布用AI替代人类执行任务的三款智能体Agent,分别是面向手机的AutoGLM,面向电脑的GLM PC,及面向网页的GLM-Web。10月,Anthropic发布具备计算机使用能力的升级版Claude 3.5 Sonnet,可指导Claude 3.5 Sonnet像人类一样使用电脑,如查看屏幕、移动鼠标、点击按钮、输入文字等。升级版Claude 3.5 Sonnet在OSWorld测试中电脑使用能力得分为AI模型中首位。根据彭博社,OpenAI正准备推出一款代号为“Operator”的全新AI Agent产品,可以自动执行编写代码、预订旅行、自动电商购物等各种复杂操作,OpenAI领导层预计或将在2025年1月发布该产品。大模型厂商AI Agent产品化进展积极,看好后续有望诞生杀手级应用。 B端:巨头加码布局,AI Agent商业化蓄势待发 AI Agent已成科技巨头必争之地。微软在Ignite 2024技术大会宣布建立全球最大的企业级AI Agent生态系统,已有超过10万家公司利用Copilot Studio创建或编辑AI智能体。谷歌推出商用AI Agent市场AI Agent Space,已提供19款解决方案,并计划在未来几个月内增加“数百个人工智能代理”产品。同时海外科技公司AI Agent产品的盈利弹性也在初步释放,如Salesforce第三季度已销售200多份Agentforce订单,并计划第四季度招聘1400名AE销售Agentforce。ServiceNow借助Now Assist AI平台业绩快速增长,有44个客户的ACV超过百万美元。 AppLovin旗下AI广告引擎AXON 2.0驱动软件平台业务收入利润双增。Shopify人工智能工具Shopify Magic显著带动产品销售。AI加持下多家海外科技公司业绩、股价表现亮眼,巨头密集布局下看好AI AgentB端商业化星辰大海。 投资建议 我们持续坚定看好AI Agent落地产业趋势,推荐金山办公、科大讯飞、同花顺、合合信息、拓尔思、焦点科技、税友股份、鼎捷数智、上海钢联、致远互联等,受益标的包括汉王科技、汉仪股份、三六零、万兴科技、泛微网络、润达医疗、彩讯股份、福昕软件、新致软件、普元信息、汉得信息等。 算力领域,推荐淳中科技、海光信息、中科曙光、浪潮信息等,受益标的包括寒武纪、紫光股份、工业富联、景嘉微、远东股份等;华为昇腾生态,推荐软通动力、神州数码、卓易信息等,受益标的包括高新发展、广电运通、烽火通信、拓维信息等。 风险提示:产业落地不及预期;市场竞争加剧风险;公司研发不及预期风险等。 1、2025年有望成为AI Agent商业化应用元年 Agent =大语言模型(LLM)+规划(planning)+记忆(memory)+工具(tools)+行动(Action)。根据曾任OpenAI安全研究副总裁翁荔(Lilian Weng)的博文,在大语言模型(LLM)驱动的Agent系统中,LLM充当Agent的大脑,并由Planning(规划)、Memory(记忆)、Tools(工具)、Action(动作)等几个关键组件补充。 规划(Planning):子目标和分解,Agent通过将大型任务分解为更小的、可管理的子目标,从而实现复杂任务的高效处理;反思与改进,Agent可以对过去的行动进行自我批评和自我反思,从错误中学习并改进未来的步骤,从而提高最终结果的质量。 记忆(Memory):短期记忆,将所有的上下文学习看成是利用模型的短期记忆来学习;长期记忆,为Agent提供了长期存储和召回信息的能力,通常通过利用外部的向量存储和快速检索实现。 工具(Tools):Agent通过学会调用外部API来获取模型权重(通常在预训练后很难修改)中缺少的额外信息,包括当前信息、代码执行能力、对专有信息源的访问等。 行动(Action):根据上述大模型结合问句(Query)、上下文的规划(Context)、各类工具,最终大模型才能决策出最终需要执行的动作是什么。 图1:Agent =大语言模型(LLM)+规划(planning)+记忆(memory)+工具(tools)+行动(Action) AI Agent是通往AGI的必由之路。从NLP到AGI的发展分为五个级别,语料库、互联网、感知、具身和社会属性。目前的大语言模型(LLM)已经来到第二层级,具有互联网规模的文本输入和输出。AI Agent在LLM的基础上再具备感知与行动的能力时,将进入到第三和第四级别。再进一步,当多个Agent通过互动合作解决更复杂的任务,或者反映出现实世界的社会行为,则有潜力来到第五层级。 图2:AI Agent是通往AGI的必由之路 Agent将显著提升大模型使用工具能力。根据智谱定义的大模型发展的五个阶段:L1语言能力、L2逻辑能力(多模态能力)、L3使用工具的能力、L4自我学习能力、L5探究科学规律。目前大模型已经初步具备了人类与现实物理世界互动的部分能力,而Agent将显著提升L3使用工具能力,同时开启对L4自我学习能力的探索。 图3:Agent将显著提升大模型使用工具能力 Agent为AI未来重点技术趋势,B端为重要落地场景。根据硅谷著名创业加速器YCombinator的数据,2023夏季和2024冬季2季创业营的AI项目中,Agent已成为最主要的技术路线之一,占比高达80%,其余为多模态、基础设施、RAG等。 其中,B端应用项目数量远高于C端应用,包括软件开发、金融、电商、CRM、医疗等。 图4:Agent为AI未来重点技术趋势,B端为重要落地场景 AI Agent场景特性:B端强调专业性,C端强调自由度。在B端应用中,AIAgent强调专业性,被广泛应用于金融、医疗、法律、财务、生产、物流、资管、人力等专业性极强的领域,往往需要专岗专职人员进行多年学习完成。在C端应用中,AI Agent强调自由度,应用于游戏、娱乐、影视、营销、广告、教育等需要更多灵感及创意的领域。 图5:AI Agent场景特性:B端强调专业性,C端强调自由度 生成式AI在金融领域应用广泛。根据Gartner调查数据,66%的银行领导人预计生成式AI的潜在收益大于潜在风险,61%的银行高管表示所在公司正在或计划未来增加对人工智能的投资。例如为用户提供财务建议的AI理财教练,在增收方面至少可以提升30%,提高效率方面能够显著减少公司为客户创建新内容所花费的时间。 图6:生成式AI在金融领域应用广泛 AI智能体在金融领域降本增效前景广阔。智能体的优势在于能够自动执行日常任务,从而释放人们的创造力,提高工作效率和生产力。Gartner列出的生成式AI在银行业20个最有前景的应用案例中,多个场景涉及AIAgent,如综合信贷数据、AI-Copilot前线应用、个性化营销内容等,利用生成式AI技术构建的数字员工,能够显著增强银行业务处理能力、优化客户体验并降低风险。 图7:AI智能体在金融领域降本增效前景广阔 AI Agent赋能医疗服务诊前、诊中和诊后众多环节。政策、技术共振驱动下,AI赋能医疗服务诸多场景。2024年11月14日,国家卫健委、国家中医药局、国家疾控局联合发布《卫生健康行业人工智能应用场景参考指引》,提出人工智能+医疗服务管理、人工智能+基层公卫服务、人工智能+健康产业发展、人工智能+医学教学科研四个类别,共计84个细分应用场景,积极推进卫生健康行业“人工智能+”应用创新发展。 图8:AIAgent赋能医疗服务诊前、诊中和诊后众多环节 AI Agent助力医疗服务提质增效。AI Agent在医疗领域的应用前景广泛,涵盖从日常辅助、影像分析、病历管理到手术支持、慢病管理等多场景,为医护人员减负、提升诊断精准度并优化患者体验提供智能支持。根据美国国家经济研究局2023年报告数据,更多地采用人工智能可以节省5%-10%美国医疗保健支出。 图9:AIAgent助力医疗服务提质增效 法律行业有望成为AI Agent重要落地应用。法律行业的数据以文本为主,并且多为绝对事实和真实案件,较为适合大模型学习。此外,法律工作的强知识性和逻辑性也让大模型能够在更多法律工作流环节中提供价值。根据ALM就美国前100律所使用AI情况的问卷调查,其中有41家律所承认正在使用AI,包括法律材料起草、文档汇总、法律研究等场景。Jackson Lewis等一些律所,还会定期为律师举办人工智能培训课程。 图10:AI广泛应用于法律材料起草、法律文档汇总、法律研究等场景 Harvey AI用户使用率快速增长,彰显法律领域对AI Agent产品的旺盛需求。 以Open AI投资的AI+法律初创公司Harvey AI为例,2023年8月-2024年8月,Harvey AI用户使用率从33%大幅增长至69%,用户留存率在一年后保持在70%左右,彰显法律领域对AI Agent产品的旺盛需求和用户对产品的较高满意度。 图11:Harvey AI用户使用率快速增长 2、C端:AI Agent初显峥嵘,静待杀手级应用 2.1、智谱:AutoGLM快速迭代,Agent覆盖手机、PC、网页端 智谱推出AI Agent智能体AutoGLM,可代替用户在手机和网页上完成操作。 10月25日,智谱推出GLM第一个产品化的智能体(Agent)——AutoGLM。只需接收简单的文字/语音指令,AutoGLM就可以模拟人类操作手机,如在微信点赞并评论朋友圈、在淘宝购买某一款历史订单产品、在携程预订酒店、在12306购买火车票、在美团点外卖等。 图12:智谱AUTOGLM手机使用能力演示:在美团点外卖 另外,AutoGLM也可以对网页进行操作,如在OpenTable网站预订餐厅等。 图13:智谱AUTOGLM网页使用能力演示:在OpenTable预订餐厅 AutoGLM测评表现优异。智谱团队在AndroidLab(即VAB-Mobile)和常见的安卓APP上的高频任务中评估了AutoGLM的能力。AndroidLab的评估结果表明,AutoGLM在AndroidLab上的成功率为36.2%,在所有对比的智能体中表现最佳。 图14:智谱AUTOGLM在AndroidLab测评表现优于其他大模型 为进一步测试AutoGLM在公共用户环境中的实际部署能力,智谱团队还在7款常见的安卓APP(包括微信、美团、淘宝、大众点评、高德地图、小红书和12306)上仔细评估了其高频任务表现。结果显示,AutoGLM在这些应用中的表现令人满意,多数任务能够完成,未完成的任务也能部分完成,从而在实际场景中为用户提供操作速度上的帮助。 图15:智谱AutoGLM在7款常见的安卓APP表现优异 网页端:智谱AUTOGLM在VAB-WebArena-Lite测评和真实网站表现优于其他大模型。智谱使用VAB-WebArena-Lite和在线人类评估数据集OpenTable进行了交互式基准测试,在这些环境中优化训练AutoGLM。 智谱AUTOGLM在VAB-WebArena-Lite测评表现优于其他大模型。使用VAB-WebArena-Lite评估了代表性的专有LLM/LMM API、开放模型、最近的智能体框架以及AutoGLM。实验结果显示,AutoGLM在该基准测试上