您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[灼识咨询]:大模型与AIGC蓝皮书 - 发现报告
当前位置:首页/行业研究/报告详情/

大模型与AIGC蓝皮书

AI智能总结
查看更多
大模型与AIGC蓝皮书

灼识咨询是一家知名咨询公司。其服务包括IPO行业咨询、商业尽职调查、战略咨询、专家网络服务等。其咨询团队长期追踪物流、互联网、消费品、大数据、高科技、能源电力、供应链、人工智能、金融服务、医疗、教育、文娱、环境和楼宇科技、化工、工业、制造业、农业等方面最新的市场趋势,并拥有上述行业最相关且有见地的市场信息。 灼识咨询通过运用各种资源进行一手研究和二手研究。一手研究包括访谈行业专家和业内人士。 二手研究包括分析各种公开发布的数据资源,数据来源包括中华人民共和国国家统计局、上市公司公告等。灼识咨询使用内部数据分析模型对所收集的信息和数据进行分析,通过对使用各类研究方法收集的数据进行参考比对,以确保分析的准确性。 所有统计数据真实可靠,并是基于截至本报告发布日的可用信息。 若您希望获取CIC灼识咨询的详细资料、与灼识建立媒体/市场合作,或加入灼识行业交流群,欢迎扫码、致电021-23560288或致函marketing@cninsights.com。 全球AI市场预计将于2030年达到1万亿美元,并且全球超过15%的GDP将由AI驱动;AI在各垂直领域的应用渗透率也将继续提升。 强/主要的 弱/次要的 AI在垂直领域中的应用 数据及AI基础设施建设 中国AI应用情况 行业 AI应用的挑战 AI占IT支出比例 中国AI支出占AI市场比例,2022 AI支出CAGR,22-27E 数据量 数据质量 IT系统成熟度 2022 2027E 不同机构之间的数据孤岛数据系统安全及隐私 金融 12.1% 11.8% 19.8% 28.1% 传统零售商获取结构化/高度可用的数据供应链机器学习算法优化 零售 5.7% 3.7% 5.7% 26.6% 专注单点技术突破,但无法跨场景规模化应用数据整合程度低,管理欠佳 制造业 8.6% 1.8% 4.4% 43.6% AI解决方案供应商分散 能源 2.6% 5.1% 9.8% 41.4% AI应用/转型进度较慢 数据分散在各医院/管理机构数据系统安全及隐私 医疗 5.6% 5.5% 8.2% 27.6% 汽车 12.3% 19.5% 25.5% 21.0% 自动驾驶数据融合难度高 不同机构之间的数据孤岛数据系统安全及隐私 政府 27.1% 21.6% 28.3% 18.7% 大模型是基于海量多源数据打造的模型,其是实现通用人工智能(AGI)的重要路径。大模型可以整合多种不同类型的数据和信息,实现多模态处理和分析,从而更全面地理解和解决复杂问题,其具备通用性、涌现性等诸多特点。 定义 AI可分为ANI(ArtificialNarrowIntelligence)、AGI(ArtificialGeneralIntelligence)和ASI(ArtificialSuperIntelligence)。ANI是专注于执行某一领域任务的经过训练的人工智能,是目前大多数的AI形式;AGI是通用人工智能,是指一种具有与人类相当的认知能力的智能系统,能够理解、学习、计划和解决问题;ASI是超级人工智能,指在几乎所有领域都超过最优秀的人类所具备的智能、知识、创造力、智慧和社交能力的智能系统。目前,ANI已经广泛应用,AGI处于研发阶段,而大模型是实现AGI的重要路径。 AI的三种类型比较 大模型是实现AGI的重要路径,其具有诸多特点 擅长领域 具备能力 发展成熟度 通用性 高投入 大模型可以快速并大规模地与云计算、互联网等其他技术结合,广泛地应用在经济的各个领域。 大模型具有重投入、长周期的特点,如每次测试需要海量的算力资源,训练一次成本高达千万美元。 某一特定领域 具备执行能力 已应用广泛 专用人工智能(ANI) 四大特点 拥有能够与人类相媲美的智慧 大部分领域 处于研发阶段 工程化 通用人工智能(AGI) 涌现性 大模型对数据、算法、算力要求极高,需要工程化的经营思路。 大模型参数超过百亿级时,模型性能会呈现出指数级增长,同时能够对未经专门训练的问题举一反三。 需要严格把控数据清洗,把控用于关键性训练的数据,和构建大规模高质量训练的算力。 所有领域 全知全能 尚处早期 超级人工智能(ASI) 大模型产业涵盖了行业应用、产品服务、模型工具和基础设施四个关键层面,广泛应用于各行业与垂直场景,前景广阔。 大模型相关产业图谱 大模型的演变经历3个阶段:基础大模型具备大量知识储备,能理解并生成内容,质量差强人意;精调大模型能按照人类偏好及普世价值取向、并保证一定安全性的前提下,生成高度可用的内容;而出现能力涌现的大模型所生成的内容接近人类水平。 高/强 低/弱 大模型演变概览 基础大模型 精调大模型 能力涌现的大模型 模型示意图,以GPT-3模型为例 指令精调示意图 能力涌现示意图 节点 … 模型根据打分结果调整后续输出,并不断重复上述过程以优化模型 共128层 模型规模 GPT-3采用了96层的多头Transformer,参数量达到1,750亿,并使用45TB数据进行训练。 指令精调在于确保模型输出结果的准确性及安全性,在该阶段需要使用较多的人工标注介入。在此基础上,引入奖励模型,让模型脱落人工指引,实现自优化。 随着模型参数的指数级增长,大模型能力呈现明显的爆发增长,呈现能力涌现的情况。 模型特征 具备大量知识储备,能理解并生成语言,质量差强人意。 能按照人类偏好及普世价值取向,并保证一定安全性的前提下生成高度可用的内容。 具备逻辑推理能力及上下文理解能力,更接近人类水平。 大模型的终端用户包括C端、B端和企业自用三类。C端用户一般使用标准化的模型产品,B端用户更倾向于选择能满足行业或企业特定需求的个性化解决方案,而企业自用的模型则旨在降低运营成本、提高运营效率、优化产品的用户体验。 大模型的终端用户分类 应用案例 主要特点 主要变现模式 主要用于个人娱乐、学习和创作标准化程度高,普适性强强调用户友好性与互动性 C端用户订阅 C端 针对企业和机构,提供针对性解决方案的大模型 通常基于基础大模型,根据不同企业、行业的需求进行一定程度的定制,模型较为异质化、用途多样 B端企业用户订阅或购买非定制化行业模型 B端 强调模型在不同领域的专业能力,以及客户的数据隐私和安全 主要用于内部业务优化 无直接变现,主要作用在于降低企业自身运营成本并提升效率 个性化定制,解决企业独特的问题和需求数据保密性至关重要,强调内部控制和数据安全 企业自用 大模型在多领域表现卓越,在自然语言理解、学习能力、视觉听觉识别等领域可以媲美甚至超越人类。提高大模型的创造能力、减少对数据的依赖性、加强隐私保护等将会是大模型迭代的重点。 大模型在不同场景中与人类表现对比 -0.4 视觉/听觉识别:基本达到甚至一定程度上超越人类,准确率较高学习能力:具备自动学习能力,在特定任务和数据集上可以超越人类 -0.6 自然语言理解:熟练掌握多种人类语言,基本达到甚至一定程度上超越人类,存在一定语言不够自然(机械化)的问题 创造性思维:能够生成创造性内容,但通常是在已知样本的基础上进行创作或是需要人类指导/二次修改 -0.8 抽象思维:相对有限,依赖于数据与模型参数 艺术表现:可以生成艺术作品,但通常缺乏情感和创新情感判断:能够进行情感分析,但不具备真实情感体验 伦理是非判断:不具备,可能引发错误或数据隐私等安全问题直觉:不具备 -1 1998 2003 2008 2013 2018 随着大模型的不断演进,它们的参数规模也呈现出指数级增长的趋势;与此同时,它们的复杂性和功能愈发提升,使得大模型能够在各领域担任更加多样和复杂的任务。 大模型的发展及参数量 分析 在大模型出现之前,机器学习算法的参数量以平均每5-6年翻一个数量级的速度快速增长,而大模型的出现使模型参数量的增长速度大幅提升。 举例而言,大模型及多模态模型的鼻祖之一GPT-2发布于2019年,参数量为15亿;GPT-3发布于2020年,参数量即达到了1,750亿,相比GPT-2增长了100多倍。粗略计算,在大模型兴起的前几年,大模型的参数量每年即可增长1-2个数量级。 在目前已公开参数量的大模型中,参数量最多的达到了1.75万亿。 大模型正在各应用场景崭露头角,其应用场景广泛且多样化。从自然语言处理到图像生成,从音频处理到视频、3D场景创建,大模型能够应对多领域的挑战。未来,大模型有望为更多应用场景带来更多机会和创新。 大模型的应用场景 及更新稿撰写 Gopher OPT Bloom Anthropic AI2 Yandex 营销(内容)销售(邮件) 通用写作记笔记 文本 模型能够理解上下文,生成更自然的文本,准确性逐渐接近人类水平,广泛应用于智能客服、文本摘要、内容生成等领域 代码生成可能在短期内对开发人员的生产力带来重大影响 GPT Tabnine 代码生成代码文档化 文本到SQL网页应用构建 编程 Stability.ai 能降低非开发人员编程的门槛 在图像识别、分割、风格转换等领域有广泛应用,能够处理复杂的视觉任务 Dall-E 2 图像生成 媒体/广告设计 图像 Craiyon 消费者/社交应用 Stable Diffusion 不同风格的图像模型以及编辑和修改生成图像技术 对声音和语音的理解能力逐渐提高,生成的音频逐渐自然、不机械,且接近人类水平 音频 语音合成 OpenAI 用于自动剪辑、特效创作、噪音修复、虚拟场景制作等,大大提升了编辑效率 视频 视频编辑/生成 X-CLIP Make-A-Video DreamFusion GET3D 在游戏、电影、虚拟现实、建筑和实体产品设计等大型创意市场极具潜力 3D 3D模型/场景搭建 MDM (MotionDiffusionModel) 大模型在多个领域的应用上取得了显著进展,文本生成、编程、图像处理等领域的能力逐渐完善,有望商业化落地。然而,3D、视频、游戏等领域发展相对较慢,但潜力巨大,需要更多时间来成熟和商业化。 大模型在不同领域的进展 建筑等) 艺术家、摄影师 就绪,性能稳定,可以投入商业应用 编程文本 文本到产品(超越全职开发者) 更多编程语言及领域 文本到产品(草稿) 商业化落地 完善垂类精调能力(例如科研论文) 终稿超越人类平均 终稿超越专业作家 显著增强开发人员工作效率 发展程度 3D及视频文件初稿 3D及视频文件二稿 为普通用户提供了编程的可能性 性能提升显著,已接近商业应用水平,但仍需微调和测试 概念模型(如产品设计、建筑等) 艺术、logo创作、摄影 基本完善 已可实现根据草图和prompt进行高清渲染 允许任何人随意探索不同的艺术主题和风格,这在以前可能需要终身学习并完善 多行代码生成 更长更准确的代码 随着3D模型的出现,生成式设计流程将延伸到制造生产,即文本到对象 基本文案及初稿撰写 更长文案及二稿撰写 参数较少,性能有限,需要进一步优化和训练 有机会为特定的终端市场构建更出色的生成型应用,例如法律合同撰写、剧本创作等 一行代码自动填写 不断增长的个性化网络及电子邮件内容需求为大语言模型提供了理想的应用场景 初试阶段 垃圾邮件检测、翻译、基本问答 时间线 大模型也已开始逐步渗透进金融、医疗、汽车、制造、零售等行业,头部大厂及垂类解决方案服务商相继推出适用于各垂直行业的解决方案,助力行业变革。 大模型在垂直行业的应用 大模型应用情况 典型案例 垂直行业 代表玩家 第四范式携手中关村银行,以“式说”大模型为基础,联合开展多模态智慧金融平台研发及私有化部署