您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [未知机构]:行业深度系列全球大模型当下和未来20250901 - 发现报告

行业深度系列全球大模型当下和未来20250901

2025-09-01 未知机构 落枫
报告封面

2025年09月01日22:48 关键词关键词 人工智能机器学习深度学习大模型ChatGPT OpenAI强化学习数据建模风险评估AIGC多模态交互开源提示词工程奖励建模泛化能力生态场景技术迭代竞争创新 全文摘要全文摘要 从1996年到当前,人工智能(AI)的发展经历了四个重要阶段。起始于1996年的AI萌芽时代,侧重于机器学习算法的起源。随后,2006年至2020年的深度学习时代,深度神经网络与大数据的融合显著提升了AI能力,阿尔法狗事件成为该时期的重要里程碑。 行业深度系列行业深度系列-全球大模型当下和未来全球大模型当下和未来20250901_导读导读 2025年09月01日22:48 关键词关键词 人工智能机器学习深度学习大模型ChatGPT OpenAI强化学习数据建模风险评估AIGC多模态交互开源提示词工程奖励建模泛化能力生态场景技术迭代竞争创新 全文摘要全文摘要 从1996年到当前,人工智能(AI)的发展经历了四个重要阶段。起始于1996年的AI萌芽时代,侧重于机器学习算法的起源。随后,2006年至2020年的深度学习时代,深度神经网络与大数据的融合显著提升了AI能力,阿尔法狗事件成为该时期的重要里程碑。2020年至今的AI2.0或大模型时代,OpenAI的ChatGPT标志着AI技术从探索转向广泛应用,引发全球范围内模型竞争,包括Google 等公司的参与。未来,AI技术将聚焦于端到端大模型、慢思考与多模态技术的创新,并强调开源策略在推动AI发展中的关键作用。 章节速览章节速览 ● 00:00 AI发展四阶段:从萌芽到大模型时代发展四阶段:从萌芽到大模型时代AI的发展历程分为四个阶段:萌芽时代(1996-2006年),机器学习算法的兴起使得AI 在数据处理方面取得进展;深度学习时代(2006-2020年),深度神经网络与大规模数据积累推动AI进入新阶段,阿尔法狗战胜人类棋手成为标志性事件;AI2.0时代(2020年至今),transformer架构与大模型的出现,尤其是ChatGPT的推出,标志着生成式AI的普及,AI正式走入大众生活。 ● 01:51大模型技术发展与全球竞争格局大模型技术发展与全球竞争格局大模型,或称大语言模型,自2018年以来,随着基于Transformer架构的模型兴起,尤其是GPT3 发布后,应用领域迅速扩展,进入普惠实用阶段。OpenAI的ChatGPT、GPT4等产品引领了行业潮流,多模态交互、视频生成、情感交互等技术不断突破。同时,全球科技巨头如Google、Meta、Anthropic等纷纷布局,形成激烈竞争。中国大模型领域亦迎来快速发展,百度文心一言、阿里千问、商汤日日新等产品不断推出,尤其是深度求索的deep seek V3和RE,以低成本高性能打破国际垄断,推动中国大模型技术实现代际跨越,加速全球AI技术普惠化。 ● 07:36大模型技术发展与应用阶段解析大模型技术发展与应用阶段解析大模型发展史中,技术核心在于概率预测与文字接龙,通过预训练、指令微调、奖励建模和强化学习四个阶段构 建。其应用经历提示词工程、有监督训练和强化学习三个重要阶段,旨在优化输出,提升有用性、准确性和安全性,解决幻觉、记忆成本等缺陷,实现与人类意图的对齐。 ● 11:10大模型技术演进:从提示词工程到强化学习大模型技术演进:从提示词工程到强化学习大模型技术经历了提示词工程、有监督微调和强化学习三个阶段。提示词工程依赖人工设计,局限性明显;有监 督微调虽降低成本,但泛化能力不足;强化学习降低数据收集成本,泛化能力强,但依赖奖励信号设置。技术迭代的关键在于成本控制,当前端到端大模型结合外部工具调用的强化微调面临长期记忆能力弱等挑战。 ● 16:33大模型市场竞争格局与生态优势分析大模型市场竞争格局与生态优势分析国内大模型市场中,豆包与deepseek形成双寡头垄断,豆包凭借通用平台加垂直爆款模式表现突出,而deep seek 因技术迭代慢、性价比下降和用户流失面临挑战。市场呈现马太效应,生态和场景成为突围关键,拥有生态优势的头部厂商将主导未来市场。 ● 20:26大模型开源趋势与行业影响分析大模型开源趋势与行业影响分析 2025年二季度,国内大模型市场竞争格局变化明显,DeepSick与Kimi的开源举措推动行业创新,降低AI应用成本,加速产业链升级。海外大模型竞争深入,头部企业推进模型开发、生态布局及商业探索,持续扩大大模型能力边界,重塑全球AI产业竞争格局。开源趋势打破技术壁垒,激发全球开发者创新潜力,促进大模型技术普惠化、多元化发展,为AI改造各行业提供持续动力。 ● 25:50 2025年大模型技术进展与未来趋势年大模型技术进展与未来趋势2025年,OpenAI在模型研发上保持领先,推出GPT4.1系列和GPT5 ,后者在编程、数学、多模态处理等方面取得显著进步,推理效率和准确性大幅提升。XAI的Group 4模型在推理计算能力上实现突破,但在多模态能力方面仍有提升空间。谷歌则加快AI布局,推出升级版的2.5系列模型和VO3视频生成模型,增强功能拓展。整体上,三大企业持续推动大模型技术发展,未来关注点将集中在结合不同应用领域实现AGI。 ● 31:09大模型在具身智能领域的应用与发展大模型在具身智能领域的应用与发展 大模型在具身智能领域的应用主要分为端到端和分层两种技术路径,其中分层大模型通过各层协作推动机器人实际应用,而端到端模型则旨在减少处理成本、提高效率,尤其适用于智能驾驶等对延迟有极高要求的场景。未来,具身智能大模型将融入更多多模态触觉,强化推理能力,并引入世界模型以提升机器人的泛化能力和环境适应性。国内外已有多个典型代表企业,如谷歌、英伟达以及心动纪元等,正推动该领域的发展。 ● 34:30端侧端侧AI模型创新:从类脑到非模型创新:从类脑到非Transformer架构的突破架构的突破讨论了端侧AI模型在消费级设备上的应用挑战与创新,包括面壁智能的mini cam 在多模态表现与能效比上的优化,以及盐山科技的燕2.0在非Transformer架构下实现的连续视频理解和神经网络记忆单元的突破,展示了端侧模型在低能耗、多模态适配等方面的显著优势。 ● 40:16大模型未来发展趋势:慢思考、多模态与开源开放大模型未来发展趋势:慢思考、多模态与开源开放 讨论了大模型未来发展的两大趋势,一是强化慢思考能力和多模态处理,提升模型推理与信息理解能力;二是开源与开放协议策略的兴起,促进模型创新与应用普及,加速行业变革。 要点回顾要点回顾 AI发展历程中的第一个阶段是什么,主要特点和进展是什么?发展历程中的第一个阶段是什么,主要特点和进展是什么? 第一个阶段被称为AI萌芽时代,大约在1996年到2006年期间。这个阶段的特点是机器学习算法的兴起,使得AI能够从数据中学习模式和规律,实现数据分类、预测等功能。在金融领域,这一时期人工智能在风险评估和预测方面取得了重要进展,为金融决策提供了支持。 深度学习时代(深度学习时代(AI1.0时代)的主要标志事件是什么?时代)的主要标志事件是什么? 深度学习时代的标志事件发生在2016年,当时阿尔法狗战胜了人类棋手,展示了AI在复杂决策领域强大的能力,标志着AI技术发展进入了一个新的阶段。 当前大模型时代(当前大模型时代(AI2.0)的核心特征及代表性事件是什么?)的核心特征及代表性事件是什么? 大模型时代(AI2.0)从2020年开始,由transformer架构的出现以及超大参数量的大模型普及所推动。2022年OpenAI推出的ChatGPT凭借出色的自然语言理解和生成能力引爆全球,打破了公众对AI应用边界的认知,并开启了AI大模型在消费级市场的传播和渗透进程。 大模型全称及发展历程中的关键技术和应用有哪些?大模型全称及发展历程中的关键技术和应用有哪些? 大模型全称为大语言模型(LLM),在2018年至2019年间随着基于transformer架构的模型出现而受到关注。自2020年GPT3发布后,大语言模型开始被广泛使用,AI应用迎来爆发式增长,从技术探索迈向普惠实用的新阶段。这些模型以自回归方式进行操作,学习复杂的语言模式并在文本生成领域表现出优势。 全球范围内大模型竞争格局如何?有哪些代表性企业及其成果?全球范围内大模型竞争格局如何?有哪些代表性企业及其成果? 全球范围内大模型竞争激烈,以OpenAI为代表的公司通过持续创新和技术突破引领发展。ChatGPT、GPT4等产品的成功展示了大模型在商业化和专业领域应用的巨大潜力。同时,国内外其他科技巨头如anthropic、Google、XCAI、Meta等也分别推出了各自的系列产品并取得了一定突破。 中国大模型的发展情况如何?有哪些具有代表性的企业或项目?中国大模型的发展情况如何?有哪些具有代表性的企业或项目? 中国大模型发展迅速,百度、阿里、字节跳动等国内企业纷纷入局并取得成果。例如,百度的文心一言打响了中国大模型发展的第一枪,阿里千问系列、Kimi等也在不断拓展功能和提升性能。尤其在2025年,深度求索的DeepSeek凭借其低成本高性能实现了弯道超车,打破了国际巨头在推理模型领域的垄断格局,推动中国大模型技术走向世界前沿。 大模型的核心机制是什么?它存在哪些主要缺陷?大模型的核心机制是什么?它存在哪些主要缺陷? 大模型的核心机制是概率预测加文字接龙,通过结合训练学习实现输入理解和结果生成。但大模型存在一些缺陷,包括可能出现幻觉导致输出结果不准确,记忆窗口有限无法有效处理长对话或多轮对话场景。典型的改进方案包括提示词工程、思维链推理和检索增强知识图谱等。 构建一个大模型的基本流程包括哪些阶段?构建一个大模型的基本流程包括哪些阶段? 构建大模型的基本流程大致分为四个阶段:预训练阶段,通过自监督学习方式训练模型的语言建模能力;指令微调阶段,使用高质量指令回答配对数据集进行有监督微调,以适应特定任务;奖励建模阶段,构建能够自动评估回答质量的奖励模型,使模型更符合人类偏好。 在大模型的发展历程中,经历了哪三个重要阶段?在大模型的发展历程中,经历了哪三个重要阶段? 大模型的发展历程经历了三个重要阶段:提示词工程阶段、有监督训练阶段以及强化学习阶段。在提示词工程阶段,通过定制化的提示词和思维链来引导模型生成预期内容;有监督训练阶段则使用了SFT方法,并随着Laura a等高效调参技术的出现而得到广泛应用;强化学习阶段中,OpenAI发布的OE展示了推理模型的强大实力,尤其是其提出的GRPO算法降低了强化学习对资源的需求,使得小团队也能进行全量套餐的强化学习训练。 强化学习相较于之前方法有哪些优点?强化学习相较于之前方法有哪些优点? 强化学习相比之前方法有显著优点,包括数据收集成本低、泛化能力强。它能让模型通过自我探索正确路径进行训练,在面对分布外情况时能做出更好的决策,从而实现模型应用的更容易扩展和部署,效果也更好。 目前国内外大模型市场格局如何?目前国内外大模型市场格局如何? 目前国内外大模型市场格局呈现双寡头垄断态势,Deep Seeking和豆包两家公司占据了接近88.9%的月活用户份额。其中,豆包凭借通用平台加垂直爆款模式,在二季度月均下载量和活跃用户数增长显著;而Deep Seeking由于技术未创新、性价比下降及用户流失等原因,市场份额有所下滑。 国产大模型市场为何呈现越来越集中的趋势?国产大模型市场为何呈现越来越集中的趋势? 国产大模型市场越来越集中的原因在于同质化问题加剧,底层技术能力差距缩小,导致用户在体验类似功能后失去新鲜感,转而倾向于选择生态和场景优势明显的头部产品,如豆包依靠字节跳动的内容和流量生态,腾讯元宝绑定微信社交场景,形成马太效应,而缺乏强大生态支持的独立AI助手如Kimi天宫等将面临生存空间被挤压的局面。 在大模型技术领域,开源的趋势中有哪些主要参与者和他们的