您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[沙利文]:2023年中国AI大模型行业白皮书 - 发现报告
当前位置:首页/行业研究/报告详情/

2023年中国AI大模型行业白皮书

信息技术2023-04-26沙利文�***
2023年中国AI大模型行业白皮书

AI大模型市场研究报告(2023)—— 迈向通用人工智能,大模型拉开新时代序幕 简介 执行摘要 经过大规模预训练的大模型,能够在各种任务中达到更高的准确性、降低应用的开发门槛、增强模型泛化能力等,是AI领域的一项重大进步。大模型最早的关注度源于NLP领域,随着多模态能力的演进,CV领域及多模态通用大模型也逐渐成为市场发展主流。政企的极大关注带动了行业领域大模型的高速发展,逐渐形成了多模态基模型为底座的领域大模型和行业大模型共同发展的局面。 伴随基于大模型发展的各类应用的爆发,尤其是生成式AI,为用户提供突破性的创新机会,打破了创造和艺术是人类专属领域的局面。AI不再仅仅是“分类”,而且开始进行“生成”,促使大模型带来的价值进一步升级到人类生产力工具的颠覆式革新。同时,数据规模和参数规模的有机提升,让大模型拥有了不断学习和成长的基因,开始具备涌现能力 (EmergentAbility),逐渐拉开了通用人工智能(AGI)的发展序幕。 过去几年,国内外的AI厂商均在大模型领域有所布局。OpenAI在2019年发布了GPT-2大模型,国内互联网科技厂商也集中在2020-2022三年期间相继发布了自己的大模型。ChatGPT的发布,掀起了一波发展热潮,原有厂商基于自身大模型开始推出一系列生成式AI应用,并对外提供API接口。更多的创业公司、科研机构和新的科技厂商涌入该市场,发布相关的产品服务。 大模型人气高涨,吸引了用户的关注,不仅是CIO、CTO等技术决策人员,CEO、CFO等业务决策人员也同样希望发挥此类模型在业务用例中的潜力。用户关注度的跃升成为对厂商自身能力的考验,前期已具备全栈大模型构建能力的厂商开始显现积累优势。 全球知名大模型发布时间节点 入的分析和评估。 2023-Apr 2023-Jan 2022-Oct 2022-Jul 2022-Apr 2022-Jan 2021-Oct 2021-Jul 2021-Apr 2021-Jan 2020-Oct 2020-Jul 2020-Apr 2020-Jan 2019-Oct 2019-Jul 2019-Apr 2019-Jan 阿里:通义千问大模型 百度:文心一言大模型 HuggingFace:BLOOM Google:Minerva(540B) 商汤:日日新大模型商汤:书生2.5 清华:GLM-130B阿里:通义大模型 StabilityAI:StableDiffusionEleutherAI: GPT-NeoX-20B AI21Labs:Jurassic-X Google:ImagenMetaAIOPT-175B Google:Palm(540B)OpenAI:InstructGPT OpenAI:DALL-E2 : DeepMind:Chinchilla Microsoft&NVIDIA:Megatron-TuringNLG530B 智源研究院:WuDao2.0OpenAI:Codex DeepMind:AlphaCode DeepMind:Gopher 商汤:书生1.0 AI21Labs:Jurassic-1-Jumbo 百度:ERNIE3.0 NAVER:HyperClova 华为:PanGu-alpha 清华&达摩院:CogViewEleutherAI: 智源研究院:WuDao-WenYuan EleutherAI: OpenAI:GPT-Neo DALL-E GPT-J-6B 百度:ERNIE-GEN(large) Microsoft:TurningNLG Google:T5-11BNVIDIA:Megatron-LM(Original,8.3B) OpenAI: GPT-3175B(davinci)Google:Meena Google:T5-3B Grover:Grover-Mega OpenAI:GPT-2 UnitedStatesUnitedKingdomChina IndiaKoreaCanadaIsraelGermany Indeterminate 为帮助用户了解国内大模型市场的发展情况、厂商格局和竞争地位,沙利文研究团队通过详实的访谈调研,对中国市场提供大模型产品服务的厂商进行了深 来源:CNCF,沙利文整理 关键发现点 AI大模型的高速发展离不开底层技术支持和应用场景迭代。大模型作为AGI时代的曙光,相关厂商也将迎来广阔的发展空间。本报告将呈现从发展现状、驱动因素洞察AI大模型厂商竞争与发展关键点,并推演竞争格局的逻辑分析过程: •前瞻洞察:通向AGI的技术路径具有多元性,目前大模型是最佳实现方式。大模型具有强大的泛化性、通用性和实用性,能够降低AI开发门槛、 提高模型精度和泛化能力、提高内容生成质量和效率等多种价值,实现了对传统AI技术的突破,并成为AGI的重要起点。进而将AI发展由数据飞轮升级到智慧飞轮,最终迈向人机共 智。大模型和人类反馈的强化学习 (RLHF)的结合,进一步重构了AI开发范式,进入大模型主导的软件2.0时代。另一方面,AI开发则形成新的“二八定律”,开发者的生产力将得到极大释放。 •驱动因素:大模型“基础设施-底层技术-基础通用-垂直应用”发展路线逐渐清晰,国内各厂商加速战略布 局,加大资金和技术投入,迎头赶上全球大模型产业化浪潮,本土化大模型迎来发展新机遇。整体上,行业驱动因素主要包含三个层面: (1)政策端:政策环境持续优化,赋能AI大模型市场高速发展。 (2)供给端:下一代AI基础设施等快速发展,助力大模型应用落地。 (3)需求端:AI市场高景气,大模型下游行业需求旺盛。 •行业观点:大模型未来发展将趋于通用化与专用化并行、平台化与简易化并进。同时,MaaS模式将成为AI应用的全新形式且快速发展,重构AI产业的商业化结构生态,激发新的产业链分工和商业模式。未来,大模型将深入应用于用户生活和企业生产模式,释放创造力和生产力,活跃创造思维、重塑工作模式,助力企业的组织变革 和经营效率,赋能产业变革。 •关键成功因素:大模型面临算力需求大、训练和推理成本高、数据质量不佳等挑战。一个可对外商业化输出的大模型的成功,要求其厂商拥有全栈 大模型训练与研发能力、业务场景落 地经验、AI安全治理举措、以及生态开放性4大核心优势,才能保证其在竞争中突出重围。其中,全栈大模型训练与研发能力还包括数据管理经验,AI基础设施建设与运营,以及大模型系统和算法设计3个关键要素。 •竞争格局:在竞争格局渐趋明晰的过程中,相关厂商需跨越技术、人才、资金等壁垒,在产品技术能力、战略 愿景能力、生态开放能力三大维度上展开角逐。通过遴选,报告选择了5家大模型厂商,分别为商汤、百度、 阿里巴巴、华为、腾讯,评价模型包 含15个一级指标、56个二级指标,对厂商大模型的各个能力进行评估。 •用户建议:通过此报告能够了解大模型厂商的竞争态势,关注领先厂商,内部创建大模型战略文件,明确其优势、带来的风险和机遇,以及部署路 线图,针对具体的用例,权衡模型的优势和风险,并选择合适场景试点、评估大模型的应用价值。 目录 章节一 AI大模型掀起时代浪潮,加速通用人工智能(AGI)时代的来临 关键发现 •以ChatGPT的发布为里程碑事件,AI的发展进入到了继突破工业红线之后的,以AGI为发展目标的全新通用智能时代。 •大模型是通向AGI时代的最佳技术路径,并开始在以自动驾驶为代表的场景下所体现。同时,大模型也带来了全新的AI开发范式,基模型+人工反馈闭环的模式给开发者带来了新的“二八定律”。 •生成式AI成为大模型能力应用的爆发点,以文生文、文生图等内容生成为代表的大模型应用快速增长,并逐渐成为日益完善的生产力工具。 AI大模型是人工智能预训练大模型的简称,包含了“预训练”和“大模型”两层含义,二者结合产生了新的人工智能模式,即模型在大规模数据集上完成预 训练后,仅需少量数据的微调甚至无需微调,就能直接支撑各类应用。这些模型通常具有多层神经网络结构,并使用高级的优化算法和计算资源进行训练,具有强大的泛化性、通用性和实用性,可以在自然语言处理、计算机视觉、智能语音等多个领域实现突破性性能提升。 AI大模型的内涵与特征 AI大模型是人工智能迈向通用人工智能的里程碑技术。以目前热门的ChatGPT为例,ChatGPT的最大贡献在于基本实 现了理想LLM的接口层,能够使LLM自主适配人的习惯命令表达方式,由此增加了LLM的易用性,提升了用户体验。InstructGPT/ChatGPT首先意识到这个问题,并给出了相应解决方案,较之前fewshotprompting方案更符合人类表达习惯。 关键发现 Transformer、GAN、CNN、 RNN等架构 通过海量数据进行预训练 泛化性通用性实用性 对新数据的适应能力解决多个任务的能力应用时的可用性和效率 模型在从未见过的数据上模型能应用于不同的数据模型能以合理的时间和资源,能表现出良好的性能能力集或任务快速处理数据并做出决策 生成式AI:基于现有数据生成全新原创内容的模型 微调以应用于不同的场景 大模型:基于大规模参数的人工智能预训练模型 LLM:基于深度学习的自然语言处理技术 解决各种复杂任务 (以ChatGPT为例:ChatGPT是LLM与RLHF技术融合革新的生成式AI代表性 产品,推动语言模型与人类意图的一致性,是从弱人工智能向强人工智能 迈出的坚实一步) ChatGPT:2022年11月OpenAI公司发布的基于LLM研发的人工智能聊天机器人 来源:张俊林《由ChatGPT反思大语言模型(LLM)的技术精要》,沙利文整理 人工智能近年来高速发展,现已经进入了以AGI为代表的新里程碑阶段。随着AI基础设施逐步完善,深度学习技术不 断进步,人工智能应用场景逐渐增多,过去模型参数规模和数据量也实现了大幅度增长,为NLP、CV等领域带来更强大的表达能力和性能。人工智能发展历程中主要有两大里程碑: 里程碑一:2012年CNN获得ImageNet第一,标志着机器视觉识别能力开始逐渐超越人眼识别准确率,开启了人工智 人工智能的发展历程 能革命。随着深度学习技术不断突破,诞生了一批“AI+场景应用”的专属模型,但是整体研发成本比较高、研发时间比较长。 里程碑二:2022年ChatGPT的出现,掀起了又一波人工智能发展热潮,以大模型+RLHF为核心的技术落地意味着人工智能开启AI新范式。人工智能相关 产业开始基于强大的基模型进行发展,通过人类反馈和强化学习不断解锁基模型的能力,以解决海量开放式任务,带来了新的研究范式。 随着AI基础设施逐步完善,深度学习技术不断进步,人工智能应用场景逐渐增多,大模型参数量以指数级速率逐步提升,数据量随着多模态的引入也实现了大规模增长AI新范式 AI+场景应用 超大模型,有人类反馈的强化学习 StableDiffusionGPT-4 提供完全不同 使用消费级显卡获可能性的多模态取文本驱动的图像模型,例如视频 AI 智能手机 智慧医疗 智慧城市 1980s1990s2012突破工业红线2022高效的通用智能 Prolog&Lisp 互联网自动驾驶DALL-E2PaLM-E 娱乐由文字生成具象化多模态高清原创图像语言大模型 专家系统机器学习算法 解答特定CNN夺得ImageNet第一领域问题ChatGPT发布 •正确率超越第二名近10% 可以理解人类语言并生成 类似人类的书面文本内容 来源:沙利文整理 AGI技术能够精准识别人类情绪意图、理解人类语言、学习人类知识并进行类脑推理与创造。OpenAI的CEO山姆 (SamAltman)对AGI的定义相当明确: 如果AI模型具有一个“普通人”学习解决问题的综合技能,能够在任何领域变得优秀,那就拥有了AGI。 大模型是目前通往AGI的最佳实现方式。以ChatGPT为代表的人工智能技术已经具备AGI的核心技术和特征,能够自动化地学习任何可