您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [未知机构]:全球大模型当下和未来20250901 - 发现报告

全球大模型当下和未来20250901

2025-09-01 未知机构 徐雨泽
报告封面

2025年09月02日20:58 关键词 大模型深度学习ChatGPT OpenAI强化学习人工智能大语言模型智能体提示词工程deep seek豆包教育领域多模态开源技术迭代生态场景竞争力推理效率端到端具身智能 全文摘要 人工智能的发展经历了从1996年至2006年的萌芽时代,着重于机器学习算法的初步应用,如金融风险评估。随后的深度学习时代(2006-2020年),深度神经网络的兴起和数据的丰富推动AI在复杂决策领域展现出巨大潜力,阿尔法狗的胜利便是典型例证。自2020年起,AI进入快速发展的2.0时代,或称大模型时代,Transformer架构和超大规模模型引领潮流,以ChatGPT为代表的生成式人工智能标志着AI正逐步渗透进大众生活。 全球大模型当下和未来-20250901_导读 2025年09月02日20:58 关键词 大模型深度学习ChatGPT OpenAI强化学习人工智能大语言模型智能体提示词工程deep seek豆包教育领域多模态开源技术迭代生态场景竞争力推理效率端到端具身智能 全文摘要 人工智能的发展经历了从1996年至2006年的萌芽时代,着重于机器学习算法的初步应用,如金融风险评估。随后的深度学习时代(2006-2020年),深度神经网络的兴起和数据的丰富推动AI在复杂决策领域展现出巨大潜力,阿尔法狗的胜利便是典型例证。自2020年起,AI进入快速发展的2.0时代,或称大模型时代,Transformer架构和超大规模模型引领潮流,以ChatGPT为代表的生成式人工智能标志着AI正逐步渗透进大众生活。当前,国内外大模型竞争激烈,技术趋势聚焦于端到端大模型在具身智能及消费级设备的应用,开源和开放协议加速了技术进步。未来,AI的发展将探索慢思考与多模态技术的融合,同时开源策略的深化将为AI技术的普及和创新提供强大动力。 章节速览 00:00 AI发展四阶段:从萌芽到大模型时代 AI的发展历程分为四个阶段:萌芽时代(1996-2006年),机器学习算法的兴起使得AI能从数据中学习模式,推动了风险识别和数据建模;深度学习时代(2006-2020年),深度神经网络与大数据积累使AI在复杂决策领域展现强大能力,标志性事件是阿尔法狗战胜李世石;AI2.0大模型时代(2020年至今),transformer架构与超大参数模型推动生成式AI普及,ChatGPT的推出标志着AI大模型技术的广泛应用,开启AI在消费级市场的传播和渗透。 01:51大模型技术发展与全球竞争格局 大模型,或称大语言模型,自2018年以来,随着基于Transformer架构的模型兴起,尤其是GPT3发布后,得到了广泛应用。OpenAI、Anthropic、Google等国际科技巨头在大模型领域持续创新,如ChatGPT、Sora等产品引领了AI技术的商业化进程。中国大模型势力也迅速崛起,百度、阿里、字节跳动等企业通过开源、多模态拓展等策略,实现了技术突破,降低了企业接入AI的门槛,推动了AI技术的普惠化,重构了全球大模型竞争生态。 07:36大模型技术发展历程与挑战 大模型通过概率预测与文字接龙机制学习语言规律,但存在幻觉与记忆限制等问题。技术发展历经提示词工程、有监督微调至强化学习三个阶段,强化学习因成本低、泛化能力强而成为主流,但仍需解决奖励信号设置不当的问题。未来趋势聚焦于端到端大模型结合外部工具调用的强化微调,旨在克服长期记忆与持续学习能力不足的挑战。 16:33大模型市场竞争格局与生态优势分析 国内大模型市场中,豆包与deep seek形成双寡头垄断,豆包凭借通用平台加垂直爆款模式表现突出,而deep seek因技术迭代缓慢、性价比下降和用户流失面临挑战。市场呈现马太效应,生态和场景成为突围关键,拥有生态优势的头部厂商将主导未来市场。 20:26大模型开源趋势与行业影响分析 2025年二季度,国内大模型市场竞争格局变化明显,豆包崛起而deep sik回落。开源趋势显著,deep sick和kimi的开源模型不仅降低了AI应用成本,还加速了技术普及与产业创新,推动了从封闭到开放的合作模式转变,重塑了产业生态。 25:24 2025年海外大模型竞争深度解析 2025年,海外大模型竞争进入深度阶段,OpenAI推出GPT4.1系列和GPT5,后者在多模态、推理效率和准确性上取得突破,尤其在编程、数学、写作等领域表现优异。XAI的group 4模型在推理计算能力上大幅提升,但在多模态方面仍有待提升。谷歌则通过升级版机密2.5系列和vo 3视频生成模型,强化了推理机制和多模态任务处理能力,同时拓展了搜索引擎功能。 30:32大模型在具身智能与消费级终端设备的发展趋势 2025年海外大模型竞争激烈,未来发展方向聚焦于具身智能和消费级终端设备。具身智能领域,端到端大模型因其高效性在智能驾驶、高端制造等低延迟要求场景中展现出潜力,同时多模态触觉融入和世界模型的引入成为关键趋势。消费级终端设备方面,端侧模型的研发挑战重重,需解决算力、功耗等问题,面壁智能的mini cam产品在能效比上取得突破,类脑模型作为新兴技术方向,正逐步展现其在低能耗、可解释性等方面的优势。 36:53非Transformer架构大模型:燕2.0的创新与应用 一家名为rock AI的公司开发了一款名为燕2.0的大模型,该模型在多项测试中超越了参数规模更大的模型,且训练效率高。燕2.0实现了连续视频理解能力和基于神经网络的记忆单元,能够在消费级硬件上运行,无需云端算力,可直接赋予终端设备智能。这款模型不仅能在多种设备上适配,还能提升模型的完整性和可持续性,可能是一次超前的创新。 40:16大模型未来发展趋势:慢思考、多模态与开源开放 讨论了大模型未来发展的两大趋势,一是强化慢思考和多模态能力,提升模型推理水平和全面理解真实世界信息;二是推动开源和开放协议,构建新的竞争力,如Meta、腾讯等企业已积极实施开源策略,MCP协议促进模型与工具的高效连接,引领大模型进入新发展阶段。 思维导图 发言总结 发言人1 他概述了人工智能的发展历程,强调了从1996年至2006年的AI萌芽时代,机器学习算法推动了AI从数据中学习模式和规律的能力。随后,2006年至2020年的深度学习时代,深度神经网络的崛起显著提升了AI能力,阿尔法狗的胜利象征着AI在复杂决策领域的巨大潜力。进入2020年至今的大模型时代,发言人着重介绍了Transformer架构和大规模参数模型如何推动生成式人工智能的发展,以OpenAI的ChatGPT为例,展示了AI应用的广泛认知和影响力。 同时,发言人探讨了国内外大模型的竞争格局和技术发展趋势,包括端到端大模型、类脑模型、非Transformer架构的探索以及大模型的开源趋势。他们强调了慢思考和多模态技术的未来发展方向,并指出了开源和开放协议对于构建大模型竞争力的重要性。整体而言,发言人的观点涵盖了AI从萌芽到成熟,再到大模型时代的演进,以及对未来技术方向和行业格局的深刻洞察。 问答回顾 发言人1问:AI发展历程中的第一个阶段是什么,主要特点和进展是什么? 发言人1答:第一个阶段被称为AI萌芽时代,大约在1996年到2006年期间。这个阶段以机器学习算法的起步发展为主,使得AI能够从数据中学习模式和规律,实现对数据的分类预测等功能。在金融领域,这一时期人工智能取得了重要进展,如风险评估和预测,为金融决策提供了支持。 发言人1问:深度学习时代(AI1.0时代)的核心事件和突破点是什么? 发言人1答:深度学习时代始于2006年,历经20年发展,深度神经网络的出现以及大规模数据积累推动了AI进入新时代。其中,2016年阿尔法狗战胜人类棋手李世石是一个里程碑事件,展示了AI在复杂决策领域的强大能力。 发言人1问:当前的AI2.0或大模型时代的特点、标志性事件以及OpenAI的ChatGPT有何影响? 发言人1答:当前时代即AI2.0或大模型时代,起始于20年,由transformer架构的出现和超大参数量大模型的普及所驱动,尤其以2022年11月OpenAI推出的ChatGPT为标志性事件。ChatGPT凭借出色的自然语言理解和生成能力引爆全球,打破了公众对AI应用边界的认知,并开启了AI大模型在消费级市场的传播和渗透进程,标志着AI真正走进 大众生活。 发言人1问:大模型的发展历程及其技术核心是什么? 发言人1答:大模型起源于2018年至2019年间,随着基于transformer架构模型的出现而受到关注。2020年GPT3发布后,大模型开始被广泛应用,推动了AI技术探索向普惠实用的新阶段发展。大模型通常采用自回归方式进行操作,即基于前面的文本预测下一个字或token的概率分布,从而学习复杂的语言模式并在文本生成领域表现出强大能力。 发言人1问:全球范围内大模型竞争格局如何,有哪些代表性企业及其创新成果? 发言人1答:全球范围内大模型竞争激烈,以OpenAI、Anthropic、Google、Meta等海外巨头为主导。其中,OpenAI凭借transformer架构和scaling law实践在大模型领域持续领先,而中国的大模型势力也在崛起,百度、阿里、字节跳动等国内企业纷纷加入竞争,其中深度求索的DeepSeek凭借其低成本、高性能和开放性,在全球大模型领域取得突破,打破了国际巨头垄断,并推进了国产大模型的飞速发展。 发言人1问:构建一个大模型的基本流程包含哪些阶段? 发言人1答:构建大模型的基本流程大致分为四个阶段:预训练阶段,通过自监督学习方式训练模型的语言建模能力;指令微调阶段,使用有监督学习方式对预训练模型进行微调,使其理解和遵循人类指令;奖励建模阶段,构建奖励模型以自动评估回答质量,对齐人类偏好;第四阶段未明确提及,但整个流程强调了模型从基础语言表达能力到特定任务对话能力的逐步提升和完善。 发言人1问:在大模型的发展历程中,经历了哪三个重要阶段? 发言人1答:大模型的发展历程中,经历了提示词工程阶段、有监督训练阶段,以及强化学习阶段。提示词工程时代主要依靠定制化的提示词和思维链来引导模型生成预期内容;有监督训练阶段通过SFT(有监督微调)方法对模型进行训练,但存在数据集构建困难和泛化能力不足的问题;强化学习阶段,特别是随着OpenAI的OE发布和GRPO算法开源,使得基于强化学习的大模型训练成为可能,并展现出显著的数据收集成本低、泛化能力强等优势。 发言人1问:强化学习相较于之前方法有哪些优点和缺点? 发言人1答:强化学习的优点在于其数据收集成本低且泛化能力强,能够通过让模型自行探索正确路径进行训练,在面对分布外情况时做出更好的决策,从而实现模型应用的扩展和部署效果更好。然而,强化学习极度依赖奖励信号设置,若奖励规则不合适,AI可能会采取违背初衷的行为。 发言人1问:目前国内外大模型市场格局如何? 发言人1答:国内方面,豆包在2023年第二季度凭借通用平台加垂直爆款模式,月均下载量达到近3000万,跃居第一,MAU为1.3亿,且活跃用户转化率显著提升。而此前的双冠王Deep Seek下载量大幅下降,市场份额被豆包、百度APP等抢走,市场呈现双寡头垄断格局。国外方面,由于技术更新滞后、性价比优势丧失等因素,DeepSeek在国内市场的表现也有所下滑。 发言人1问:国内大模型市场中,为何其他厂商的产品月活用户出现大幅下滑? 发言人1答:其他通用AI助手产品如腾讯元宝、Kimi等月活用户下滑的主要原因包括缺乏技术创新、性价比被竞争对手超越以及用户被头部产品吸引等原因。同时,国产大模型市场正逐渐向头部产品集中,像豆包依靠强大的生态支持和高频刚需服务留住客户,而缺乏生态优势的产品生存空间将受到挤压,竞争焦点已转向通用能力与生态场景的综合实力。 发言人1问:在大模型领域,有哪些开源趋势值得关注? 发言人1答:其中一个值得关注的开源趋势是deep seek和ki