事件:阿里巴巴于3月6日凌晨发布并开源全新的推理模型通义千问QwQ-32B。通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现了质的飞跃,整体性能比肩DeepSeek-R1。在保持强劲性能的同时,千问QwQ-32B还大幅降低了部署使用成本,在消费级显卡上也能实现本地部署。此外,monica AI正式对外发布通用型AI Agent产品Manus,据该团队介绍,Manus在GAIA基准测试中取得了SOTA(State-of-the-Art)的成绩,显示其性能超越OpenAI的同层次大模型。 QwQ-32B性能比肩DeepSeek-R1,支持消费级显卡本地部署。阿里巴巴发布并开源全新的推理模型通义千问QwQ-32B,在数学、代码及通用能力上整体性能比肩DeepSeek-R1。QwQ-32B拥有320亿参数规模,而DeepSeek-R1则具备6710亿参数(其中370亿被激活)。因此,阿里巴巴QwQ-32B显著降低了部署使用成本,在消费级显卡上也能实现本地部署。因此开发者和企业可以轻松将其部署到本地设备中,进一步打造高度定制化的AI解决方案,适合快速响应或对数据安全要求高的应用场景。此外,该模型在冷启动基础上,阿里通义团队针对数学和编程任务、通用能力分别进行了两轮大规模强化学习,在32B的模型尺寸上获得了令人惊喜的推理能力提升,印证了大规模强化学习可显著提高模型性能。我们认为强大的基础模型叠加大规模强化学习或为通往AGI的可行之路,亦将持续推动我国AI应用生态蓬勃发展。 全球首款通用型AI Agent产品Manus正式发布,持续赋能国内Agent生态。Manus作为通用型AI Agent产品, 其GAIA评分超越OpenAI的DeepResearch,Lv1-3正确率分别为86.5%/70.1%/57.7%,创下GAIA基准测试新纪录。区别于Chatbot的简单问答,当用户提出问题之后,Manus会根据问题以及要求进行任务拆解以及规划和执行,具备独立思考与执行复杂任务的能力,官网展示的案例中,它能直接交付完整成果,远超OpenAI同类产品。例如,官方向Manus发送了一个包含10份简历的压缩文件,Manus可以解压文件并逐个浏览每份简历,最后给出排名建议,并提供了候选人资料和评估标准作为参考;此外Manus还能异步处理文件,用户可以随时关闭电脑,等任务完成后Manus会通知用户。我们认为Manus发布标志着国内通用型Agent能力的巨大提升,或成为AGI发展的重要一步。 相关标的:阿里巴巴-SW,腾讯控股,百度集团-SW,快手-W,哔哩哔哩-SW,迈富时,焦点科技,巨人网络,蓝色光标,美图公司。 风险提示:AI技术进展不及预期,应用落地不及预期,AIAgent落地不及预期,AI商业化进程不及预期。 长城证券股份有限公司(以下简称长城证券)具备中国证监会批准的证券投资咨询业务资格。 本报告由长城证券向专业投资者客户及风险承受能力为稳健型、积极型、激进型的普通投资者客户(以下统称客户)提供,除非另有说明,所有本报告的版权属于长城证券。未经长城证券事先书面授权许可,任何机构和个人不得以任何形式翻版、复制和发布,亦不得作为诉讼、仲裁、传媒及任何单位或个人引用的证明或依据,不得用于未经允许的其它任何用途。如引用、刊发,需注明出处为长城证券研究院,且不得对本报告进行有悖原意的引用、删节和修改。 本报告是基于本公司认为可靠的已公开信息,但本公司不保证信息的准确性或完整性。本报告所载的资料、工具、意见及推测只提供给客户作参考之用,并非作为或被视为出售或购买证券或其他投资标的的邀请或向他人作出邀请。在任何情况下,本报告中的信息或所表述的意见并不构成对任何人的投资建议。在任何情况下,本公司不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任。 长城证券在法律允许的情况下可参与、投资或持有本报告涉及的证券或进行证券交易,或向本报告涉及的公司提供或争取提供包括投资银行业务在内的服务或业务支持。长城证券可能与本报告涉及的公司之间存在业务关系,并无需事先或在获得业务关系后通知客户。 长城证券版权所有并保留一切权利。