热门搜索：

大模型与AIGC蓝皮书

信息技术2023-11-30灼识咨询F***

AI智能总结

大模型与AIGC蓝皮书报告总结：

大模型概述

灼识咨询：作为一家知名咨询公司，专注于提供包括IPO行业咨询、商业尽职调查、战略咨询、专家网络服务在内的全方位服务。其团队追踪全球各地的市场趋势，特别是在物流、互联网、消费品、大数据、高科技、能源电力、供应链、人工智能、金融服务、医疗、教育、文娱、环境和楼宇科技、化工、工业、制造业、农业等领域，积累了丰富的行业洞察。
研究方法：采用一手研究（访谈行业专家、业内人士）和二手研究（分析公开发布的数据资源，如中华人民共和国国家统计局、上市公司公告）相结合的方式，确保信息的真实性和时效性。

AI与大模型的关键特性

大模型：是实现通用人工智能（AGI）的重要途径，具有涌现性、工程化、高投入和通用性等特点。参数规模巨大（数十亿到数千亿），能够处理多种类型的输入（文本、图像、音频、视频），展示出在多领域内的高水平表现。
发展轨迹：经历了从基础大模型到精调大模型，再到能力涌现的大模型三个阶段。每个阶段的模型在知识储备、语言生成、逻辑推理、上下文理解等方面展现出不同程度的改进和突破。

大模型的终端用户分类

C端用户：个人娱乐、学习和创作，注重用户友好性和互动性，主要通过订阅模式获得服务。
B端用户：企业或机构，提供定制化解决方案，强调模型的专业能力、数据隐私和安全，主要用于内部业务优化。
企业自用：内部部署，旨在降低成本、提高效率，重视数据保密性和内部控制。

大模型的应用场景

文本生成：营销、销售、编程、记笔记、内容创作等。
图像处理：图像生成、编辑、风格转换等。
音频合成：语音合成。
视频编辑/生成：自动剪辑、特效创作、虚拟场景制作等。
3D建模：游戏、电影、虚拟现实、建筑、实体产品设计等。

大模型的发展与政策

政策支持：中国政府发布多项政策，鼓励人工智能发展，特别是2015年《中国制造2025》和2017年《新一代人工智能发展规划》，为大模型及相关技术提供了政策支持和指导。
法规监管：随着大模型能力的增强，相关政策开始关注生成式人工智能服务的合规性，确保服务遵守法律法规，体现社会主义核心价值观。

大模型的案例与应用

金融、医疗、汽车、制造、零售等行业已开始应用大模型，解决特定领域的问题，如风险评估、疾病诊断、自动驾驶等。
百度文心、GPT系列等大模型在自然语言处理、生成图像、代码编写等领域展现出强大的能力，推动了技术创新和应用的普及。

AIGC概览

AIGC（AI Generated Content）作为内容生产的新形态，通过AI自动生成内容，改变了传统的PGC（专业生产内容）和UGC（用户生成内容）模式，开启了智能创作的新时代。AIGC的兴起预示着新一轮的产业革命，将深刻影响内容产业乃至整个社会的生产方式。

结论

大模型和AIGC代表了人工智能领域的前沿技术和应用趋势，正推动着智能时代的到来。通过不断的技术创新和政策引导，这些技术将在更多领域展现出其巨大的潜力和影响力，为人类社会带来前所未有的改变和提升。

灼识咨询是一家知名咨询公司。其服务包括IPO行业咨询、商业尽职调查、战略咨询、专家网络服务等。其咨询团队长期追踪物流、互联网、消费品、大数据、高科技、能源电力、供应链、人工智能、金融服务、医疗、教育、文娱、环境和楼宇科技、化工、工业、制造业、农业等方面最新的市场趋势，并拥有上述行业最相关且有见地的市场信息。灼识咨询通过运用各种资源进行一手研究和二手研究。一手研究包括访谈行业专家和业内人士。二手研究包括分析各种公开发布的数据资源，数据来源包括中华人民共和国国家统计局、上市公司公告等。灼识咨询使用内部数据分析模型对所收集的信息和数据进行分析，通过对使用各类研究方法收集的数据进行参考比对，以确保分析的准确性。所有统计数据真实可靠，并是基于截至本报告发布日的可用信息。若您希望获取CIC灼识咨询的详细资料、与灼识建立媒体/市场合作，或加入灼识行业交流群，欢迎扫码、致电021-23560288或致函marketing@cninsights.com。全球AI市场预计将于2030年达到1万亿美元，并且全球超过15%的GDP将由AI驱动；AI在各垂直领域的应用渗透率也将继续提升。强/主要的弱/次要的 AI在垂直领域中的应用数据及AI基础设施建设中国AI应用情况行业 AI应用的挑战 AI占IT支出比例中国AI支出占AI市场比例，2022 AI支出CAGR，22-27E 数据量数据质量 IT系统成熟度 2022 2027E 不同机构之间的数据孤岛数据系统安全及隐私金融 12.1% 11.8% 19.8% 28.1% 传统零售商获取结构化/高度可用的数据供应链机器学习算法优化零售 5.7% 3.7% 5.7% 26.6% 专注单点技术突破，但无法跨场景规模化应用数据整合程度低，管理欠佳制造业 8.6% 1.8% 4.4% 43.6% AI解决方案供应商分散能源 2.6% 5.1% 9.8% 41.4% AI应用/转型进度较慢数据分散在各医院/管理机构数据系统安全及隐私医疗 5.6% 5.5% 8.2% 27.6% 汽车 12.3% 19.5% 25.5% 21.0% 自动驾驶数据融合难度高不同机构之间的数据孤岛数据系统安全及隐私政府 27.1% 21.6% 28.3% 18.7% 大模型是基于海量多源数据打造的模型，其是实现通用人工智能（AGI）的重要路径。大模型可以整合多种不同类型的数据和信息，实现多模态处理和分析，从而更全面地理解和解决复杂问题，其具备通用性、涌现性等诸多特点。定义 AI可分为ANI(ArtificialNarrowIntelligence)、AGI(ArtificialGeneralIntelligence)和ASI(ArtificialSuperIntelligence）。ANI是专注于执行某一领域任务的经过训练的人工智能，是目前大多数的AI形式；AGI是通用人工智能，是指一种具有与人类相当的认知能力的智能系统，能够理解、学习、计划和解决问题；ASI是超级人工智能，指在几乎所有领域都超过最优秀的人类所具备的智能、知识、创造力、智慧和社交能力的智能系统。目前，ANI已经广泛应用，AGI处于研发阶段，而大模型是实现AGI的重要路径。 AI的三种类型比较大模型是实现AGI的重要路径，其具有诸多特点擅长领域具备能力发展成熟度通用性高投入大模型可以快速并大规模地与云计算、互联网等其他技术结合，广泛地应用在经济的各个领域。大模型具有重投入、长周期的特点，如每次测试需要海量的算力资源，训练一次成本高达千万美元。某一特定领域具备执行能力已应用广泛专用人工智能(ANI) 四大特点拥有能够与人类相媲美的智慧大部分领域处于研发阶段工程化通用人工智能(AGI) 涌现性大模型对数据、算法、算力要求极高，需要工程化的经营思路。大模型参数超过百亿级时，模型性能会呈现出指数级增长，同时能够对未经专门训练的问题举一反三。需要严格把控数据清洗，把控用于关键性训练的数据，和构建大规模高质量训练的算力。所有领域全知全能尚处早期超级人工智能(ASI) 大模型产业涵盖了行业应用、产品服务、模型工具和基础设施四个关键层面，广泛应用于各行业与垂直场景，前景广阔。大模型相关产业图谱大模型的演变经历3个阶段：基础大模型具备大量知识储备，能理解并生成内容，质量差强人意；精调大模型能按照人类偏好及普世价值取向、并保证一定安全性的前提下，生成高度可用的内容；而出现能力涌现的大模型所生成的内容接近人类水平。高/强低/弱大模型演变概览基础大模型精调大模型能力涌现的大模型模型示意图，以GPT-3模型为例指令精调示意图能力涌现示意图节点 … 模型根据打分结果调整后续输出，并不断重复上述过程以优化模型共128层模型规模 GPT-3采用了96层的多头Transformer，参数量达到1,750亿，并使用45TB数据进行训练。指令精调在于确保模型输出结果的准确性及安全性，在该阶段需要使用较多的人工标注介入。在此基础上，引入奖励模型，让模型脱落人工指引，实现自优化。随着模型参数的指数级增长，大模型能力呈现明显的爆发增长，呈现能力涌现的情况。模型特征具备大量知识储备，能理解并生成语言，质量差强人意。能按照人类偏好及普世价值取向，并保证一定安全性的前提下生成高度可用的内容。具备逻辑推理能力及上下文理解能力，更接近人类水平。大模型的终端用户包括C端、B端和企业自用三类。C端用户一般使用标准化的模型产品，B端用户更倾向于选择能满足行业或企业特定需求的个性化解决方案，而企业自用的模型则旨在降低运营成本、提高运营效率、优化产品的用户体验。大模型的终端用户分类应用案例主要特点主要变现模式主要用于个人娱乐、学习和创作标准化程度高，普适性强强调用户友好性与互动性 C端用户订阅 C端针对企业和机构，提供针对性解决方案的大模型通常基于基础大模型，根据不同企业、行业的需求进行一定程度的定制，模型较为异质化、用途多样 B端企业用户订阅或购买非定制化行业模型 B端强调模型在不同领域的专业能力，以及客户的数据隐私和安全主要用于内部业务优化无直接变现，主要作用在于降低企业自身运营成本并提升效率个性化定制，解决企业独特的问题和需求数据保密性至关重要，强调内部控制和数据安全企业自用大模型在多领域表现卓越，在自然语言理解、学习能力、视觉听觉识别等领域可以媲美甚至超越人类。提高大模型的创造能力、减少对数据的依赖性、加强隐私保护等将会是大模型迭代的重点。大模型在不同场景中与人类表现对比 -0.4 视觉/听觉识别：基本达到甚至一定程度上超越人类，准确率较高学习能力：具备自动学习能力，在特定任务和数据集上可以超越人类 -0.6 自然语言理解：熟练掌握多种人类语言，基本达到甚至一定程度上超越人类，存在一定语言不够自然（机械化）的问题创造性思维：能够生成创造性内容，但通常是在已知样本的基础上进行创作或是需要人类指导/二次修改 -0.8 抽象思维：相对有限，依赖于数据与模型参数艺术表现：可以生成艺术作品，但通常缺乏情感和创新情感判断：能够进行情感分析，但不具备真实情感体验伦理是非判断：不具备，可能引发错误或数据隐私等安全问题直觉：不具备 -1 1998 2003 2008 2013 2018 随着大模型的不断演进，它们的参数规模也呈现出指数级增长的趋势；与此同时，它们的复杂性和功能愈发提升，使得大模型能够在各领域担任更加多样和复杂的任务。大模型的发展及参数量分析在大模型出现之前，机器学习算法的参数量以平均每5-6年翻一个数量级的速度快速增长，而大模型的出现使模型参数量的增长速度大幅提升。举例而言，大模型及多模态模型的鼻祖之一GPT-2发布于2019年，参数量为15亿；GPT-3发布于2020年，参数量即达到了1,750亿，相比GPT-2增长了100多倍。粗略计算，在大模型兴起的前几年，大模型的参数量每年即可增长1-2个数量级。在目前已公开参数量的大模型中，参数量最多的达到了1.75万亿。大模型正在各应用场景崭露头角，其应用场景广泛且多样化。从自然语言处理到图像生成，从音频处理到视频、3D场景创建，大模型能够应对多领域的挑战。未来，大模型有望为更多应用场景带来更多机会和创新。大模型的应用场景及更新稿撰写 Gopher OPT Bloom Anthropic AI2 Yandex 营销（内容）销售（邮件）通用写作记笔记文本模型能够理解上下文，生成更自然的文本，准确性逐渐接近人类水平，广泛应用于智能客服、文本摘要、内容生成等领域代码生成可能在短期内对开发人员的生产力带来重大影响 GPT Tabnine 代码生成代码文档化文本到SQL网页应用构建编程 Stability.ai 能降低非开发人员编程的门槛在图像识别、分割、风格转换等领域有广泛应用，能够处理复杂的视觉任务 Dall-E 2 图像生成媒体/广告设计图像 Craiyon 消费者/社交应用 Stable Diffusion 不同风格的图像模型以及编辑和修改生成图像技术对声音和语音的理解能力逐渐提高，生成的音频逐渐自然、不机械，且接近人类水平音频语音合成 OpenAI 用于自动剪辑、特效创作、噪音修复、虚拟场景制作等，大大提升了编辑效率视频视频编辑/生成 X-CLIP Make-A-Video DreamFusion GET3D 在游戏、电影、虚拟现实、建筑和实体产品设计等大型创意市场极具潜力 3D 3D模型/场景搭建 MDM (MotionDiffusionModel) 大模型在多个领域的应用上取得了显著进展，文本生成、编程、图像处理等领域的能力逐渐完善，有望商业化落地。然而，3D、视频、游戏等领域发展相对较慢，但潜力巨大，需要更多时间来成熟和商业化。大模型在不同领域的进展建筑等）艺术家、摄影师就绪，性能稳定，可以投入商业应用编程文本文本到产品（超越全职开发者）更多编程语言及领域文本到产品（草稿）商业化落地完善垂类精调能力（例如科研论文）终稿超越人类平均终稿超越专业作家显著增强开发人员工作效率发展程度 3D及视频文件初稿 3D及视频文件二稿为普通用户提供了编程的可能性性能提升显著，已接近商业应用水平，但仍需微调和测试概念模型（如产品设计、建筑等）艺术、logo创作、摄影基本完善已可实现根据草图和prompt进行高清渲染允许任何人随意探索不同的艺术主题和风格，这在以前可能需要终身学习并完善多行代码生成更长更准确的代码随着3D模型的出现，生成式设计流程将延伸到制造生产，即文本到对象基本文案及初稿撰写更长文案及二稿撰写参数较少，性能有限，需要进一步优化和训练有机会为特定的终端市场构建更出色的生成型应用，例如法律合同撰写、剧本创作等一行代码自动填写不断增长的个性化网络及电子邮件内容需求为大语言模型提供了理想的应用场景初试阶段垃圾邮件检测、翻译、基本问答时间线大模型也已开始逐步渗透进金融、医疗、汽车、制造、零售等行业，头部大厂及垂类解决方案服务商相继推出适用于各垂直行业的解决方案，助力行业变革。大模型在垂直行业的应用大模型应用情况典型案例垂直行业代表玩家第四范式携手中关村银行，以“式说”大模型为基础，联合开展多模态智慧金融平台研发及私有化部署

点击免费查看完整报告