WESTERN西部证券 行业周报通信 MultiOn发布AlAgentQ,谷歌Al手机Pixel9抢先落地证券研究报告 2024年08月18日 AI行业跟踪35期(20240812-20240816) 核心结论 行业要闻追踪分析师 陈影 和创公司MultiOn发布高效AIAgentQ,智能体是大模型落地的核心交互 $0800522100004 介质。我们认为,智能体应用正处于快速增长期,市场格局尚未明确,开发chentongg@research.xbmei.com.cn 门仍需进一步降低。为争李份额,以字节跳动、阿里、百度和腾讯为代表相关研究 AI行生乐路34期 的厂商平台纷纷加入份格成,调整了填下大模型产品的定价策略。与此同时,送信:Googie伊化A#工具,Figure 当前许多平台存在操作流程紫填、界面不友好等问题。复杂的功能设置和参(20240805-20240809)2024-08-12 数调整让用户感到围感,增加了使用的难度和学习成本,仍有较多待优化的 送布信最:G新oo财gle技准出新模A型I行,北业美联科路技大3厂3或 地方。 (20240729-20240802) 2024-08-07 送信:Llama3.1与用源模型差馆小,容 (20240722-20240726)2024-07-28 谷歌GeminiLive抢先落地,Al手机军备竞赛加剧。我们认为,随着谷款时AI投资志度权级—AI行业源多32期 抢跑推出GeminiLive,有望进一步加剧端侧AI的军备竞券力度。近一年未 已经发布的AI手机,各大厂商均把大模型当作了自已的核心宣传卖点。从 需求侧看,用户的需求在于AI而非"AI享头”,仅有真正提升用户体验感的 AI功能才能够激发鲜热潮过后的长期需求: 行情回顾 本周(08.12-08.16),我们构建的西部AI股票池中,其中108家A股公司整 体周平沟涨幅1.76%,59家美股公司整体周平均涨幅7.03%。A股各板块 至现不同涨%,液冷散热板块上涨3.74%,光模块板块上涨3.27%:美股各 板块全面上涨,其中光模板块涨幅量大,上涨14.17%,服务器板块上涨 13.19%根据舌部通信股票池,A股市场中本周(08.12-08.16)涨幅居前十 的个股分别是富券股份(+52.55%)、飞荣达(+9.68%)、胜宏科技(+9.19%)、锐捷网络(+8.19%)、天享通信(+7.74%)、永鼎股份(+7.20%)、天源迪科(+6.97%)、海光信息(+6.71%)、荣联称技(6.68%)、中际旭创 (+6.60%)。美股市场中本周(08.12-08.16)涨%居前五的个股分别是超微 电脑(+23.59%)、BuzzFeed(+22.51%),Coherent(+20.98%)、戴尔 科技(+20.25%)、Lumentum拉股(+20.19%) 投资建议:AIGC和数字中国共振,算力托底。建议重点关注AI算力硬件, 关注光模块(中际旭创、天享通信、源杰科技等):散热领域(英维竞)及 ICT设备商等。 风险提示:技术落地不及预期、硬件设备市场接受度不及预期、监管政策风险、中美贸易摩擦风险 1「请务要行端阅读技告是部的投资学线说明和明 行业周报「通信 索引 西部证券 202408月18日 内容目录 AI行业重点事件点评 1.1初创公司MultiOn发布高效AlAgentQ,智能体是大➓型落地✁核心交互➴质.3 1.2谷致GeminiLive抢先落地,Al手机军各竞赛加剧. AI行业动态一览.6 2.1国外价业动态.6 2.2国内行业动态。7 2.3行业最会/大会前瞻流理 三、AI行情回顾:美股光模法额涨 四、投资建汉:持续关注AI应用和算力基础设施 五、风险提示, 图表目录 图1:AgentQ在执行预订任务时的步象标解 图2:完整的AI反馈过程 图3:WebShop实验结果..图4:OpenTable实验结果..图5:GeminiLive界面示意 图6:GeminiLive不同声音选择 图7:A股A1行业分板块周涨跌满对比(08.12-08.16)图8:美股AI行业细分板块月涨跌幅对比(08.12-08.16) WESTERN西部证券 行业周报【通信 AI行业重点事件点评 西部证券 202408月18 1.1初创公司MultiOn发布高效AlAgentQ,智能体是大模型落地✁核心交互 介质 事件:初创公司MultiOn最近发市了号称目前最强”✁AgentQ,在真实✁预订任务中 可以达到95.4%✁成功率。 点评: 点评1:技术端,AgentQ拥有规划、推理能力,以及自我修复功能,解决了此前LLM训练技术✁局限性。近年未,虽热LLM已经彻底额覆了NLP领域并取得了基著成就,但 在交互环境中仍西临重大挑战,无其多步推理任务,加如同页导航。当前依赖静态语言数据 集✁训练方法,不足以使这些模型造应动态✁现实世界互动。AgentQ✁出现是AI智能 体领或✁一个重大里程碑,其结合了搜索、自我反思和强化学习,能够进行规划和自我修复。它✁训练方法结合了蒙特卡洛树搜索(MCTS)和自我批评,并且通过一种叫做直➓偏好优化(DPO)✁算法来学习人类✁反绩,解决了之前LLM训练技术✁局限性,使其 能够实现自主网页导航。与此月时,作为相有规划和AI自我修复功能✁下一代AI智能 体,AgentQ✁性能是LLama3基线零样本性能✁3.4传。同时,在真实场景任务✁ 评估中,AgentQ✁成功率达到了95.4%。其关键组件包括: 1)基于MCTS✁引导式搜索:通过探索不同✁行为和网页自主生成数据,并在深索 (exploration)和利用(exploitation)之间取得平衡。MCTS使用较高✁采样温度和多样 化提示调未扩展行为空间,确保能收集到多样化且最优✁轨连。 2)AI自我批评:每个步累中,基于AI✁自我批评都危提供有份值✁反馈,从而优化智能体✁决策。这种步累级反馈对于长周期任务至关重要,因为作蔬信号往往导改学习围难。 3)直➓偏好优化:DPO算法通过构✁由MCTS生成数诺✁偏好对来微调模型。这种 off-policy✁训练方法允许模型从聚合数据集中有效学习,包括搜索过程中探索✁次优分 支,从而提高复杂环境中✁成功率。 图1:AgentQ在执行预订任务时✁步累折屏图2:完整✁AI反绩玲程 f+*::AgentQ:AdvancedReasoningandLeamigforAutonomousA/HR源:AgerQ:AdvancedReasoningandLeamingforAutonomcusAr Agonts,要证券研发中心Agents,西事注证券节发中心 点评2:测试实验中,研究者设定了模拟网上商店和模拟订餐实验检验AgentQ在真实 3「请务要于阅动投告是部✁投资公级流明和声明WESRN西部证券 行业周报【通信 西部证券 202408月18日 世界中✁表现。1)在实验1楼就商店(WebShop)实验中,基于xLAM-v0.1-r模型构 ✁✁用于模秘网上商店✁任务中,agent需要进行提索以找到特定商品。虽然RFT、DPO和集束披索等方法也能实现一定提升,但幅度不及AgentQ。如果同时使用AgentQ和MCTS方法,任务成功率即可从28.6%提升至50.5%,相当于平对人类水平50%:2)在实验2模拟订餐任务(OpenTable)真实预订任务中,AgentQ需要执行多个步骤,包 括找到对点✁餐厅页面、选择合适✁日期讨间、根据用户偏好理择合造✁座位、提交用户 ✁联络方式,最后完成任务。这个复杂度较Webshop上了一个台阶。根据实验后✁统计, 完成Webshop任务✁平均步聚为6.8,OpenTable则翻了一倍达到13.9,由于OpenTable 并非模拟数据集,而是真实✁在线环境,很欢进行自动化评估,国此论文使用了GPT-4-V作为评估者,根据预先定义✁指标对agent每个步✁操作给予奖励值,并标记任务是否完成.AgentQ将LLaMa-3✁零样本成功率从18.6%提升至81.7%,分数提高比例达340%, 而且仅经过了一天✁自主数据妆集。加入在线✁蒙特卡罗树披索后,成功率能送一步提高 纠95.4% 图3:WebShop实验结聚图4:OpenTable实验总第 WirtShepSuccessRates if*2;AgentQ:AdvancedReasonngandLeamingforAutonomousA/爱料A源:AgenfQ:AdvancedReasoningandLeamingforAutonomousAr Agents,i证券研义中心Agents,i心 点评3:头部金业相维推出智能体,智能体是大模型落地✁核心交互介质。2024年1月,OpenAl推出名为GPTStore✁平台,允许用户创✁、发统和使用针对各种目✁定制✁GPT,选一步降低了AI智能体应用✁开发和使用门提。国内多家互联同大厂也纷纷布局, 如字节✁扣子、腾讯✁元器、以及百度✁APPBulider等,这些AI应用商店不仅可以创作AI智能体产品,还可以对创作出✁产品进行分发。7月30日于上海举办✁2024京东云 峰会上,高东正式发布一站式智危体开发平台,言革智能体平台。京东云判斯,智能体、 数字人、具身智能是术来大模型与终端用户✁核心交互介质。百度CEO李彦宏在WAIC 2024演讲中表示,“智能体是我们最看好✁AI应用发展方向,搜索是智能体分发✁最大入口"。而在2024春季火山引擎FORCE原动力大会上,扣子产品经理潘字扬介绍,和 子作为字节距动推出✁新一代AI应用开发平台,会填补大模型到用户场景✁最后一公里。 我们认为,智能体应用正处于快追增长期,市场格局尚未明确,开发门槛仍需进一步降低。据MarketsandMarkets数据,2019年全球自主智能体市场规模为3.45亿美元,预计到2024年将达到29.92亿关元。当前市场格局尚不明晰,为争夺份额,以字节跳动、阿里、 百度和腾讯为代表✁厂商平台纷纷加入价格战,调整了旗下大模型产品✁定价策略。与此 同时,当前评多平台存在操作流程繁项、界面不友好等问题。复杂✁功能设置和参数调整让用户感到困感,增加了使用✁难度和学习成本,仍有较多待优化✁地方。 4「请务要行端阅读技告是部✁投资节线说明和明WES.FRN西部证券 行业周报【通信 1.2谷歌GeminiLive抢先落地,Al手机军备竞赛加剧 西部证券 2024年08月18日 事件:北京时间8月14日谷我MadebyGoogle年度发会如期季行,发布了四款TensorG4Pixel9Al手机,并公布了容歌Gemini✁最新进展。会上谷歌发布了对标Gpt-4o高 阶语音瓶✁GeminiLive,并且针对所有✁GeminiAdvanced用户开放,端侧系统级应用 载据联动功能则优先萃果落地。谷歌✁先进板Al助手GeminiLive现已在三星智能手机 上推出,甚至早于Pixel9系列✁发布。这意味着三智能手机和平板电脑成为前批体验 GeminiLive✁设备。但GeminiLive月前仅对Gemini付费点订阅用户开效。 点评: 点评1:谷歇Pixel手机深度融合了AI技术,探案手机+AI新样态。谷获北次年度发布会 ➴绍了Pixel9系列✁Al驱动✁新功能,重点包括内置✁Al助手GeminiLive、增强✁照 片处理工具、图像生成器、定制✁天气预告、屏募截图信息回忆、保存通活中✁记录和细 节等。其中,关于具备多模态识别能力✁智能语音动手GeminiLive,用户可以通过文本、 图像或语音与其进行交流。GeminiLive对标OpenAIChatGPT最新上线✁AdvancedVoice模式(限量Alpha测试),采用了增强型语音引擎,可以展开更连贯、更有情感表达力、更逐真✁多轮对话。 点评2:GeminiLive✁核心特性在于其自然、流畅✁交互体验,并与其他应用程序和工 县连➓。用户能够像与普通人交流一样,与这个AI助