行业研究公司研究宏观策略财报招股书会议纪要稳定币低空经济 DeepSeek AIGC 智能驾驶大模型

2022年中国AIGC行业研究报告：蓄势待发，数字内容的工业革命（摘要版）

信息技术2023-04-05头豹研究院机构上传

AI智能总结

本报告是头豹研究院2022年中国AIGC行业研究报告，主要介绍了AIGC的定义、内涵、发展历程、分类及应用现状等内容。AIGC是基于人工智能技术自动生成数字内容，如文本、图谱、音视频等，其优势在于能够突破人力创作的限制，在保证一定质量水平的同时，最大程度地降低创作门槛及释放内容生产力。AIGC的应用可分为文本生成、图像生成、音频生成、视频生成和虚拟人生成五大类别，其中当前AIGC的应用以文本生成和图像生成为主。报告还指出，AIGC是元宇宙的重要基础设施，能够突破人工限制，带来元宇宙所需的丰富多元的内容。

行业背景：热点事件定义及内涵发展历程分类及应用现状 AIGC行业综述——定义与内涵 AIGC是基于人工智能技术自动生成数字内容，如文本、图谱、音视频等；与PGC和UGC模式相比，AIGC的优势在于能够突破人力创作的限制，在保证一定质量水平的同时，最大程度地降低创作门槛及释放内容生产力 PGC、UGC和AIGC的产能及生产效率内容产量受AI技术成熟度所限受内容质量所限 AlGC 元宇宙的重要基础设施 PGC和UGC分别被产能和质量所限制，AIGC在保证一定质量水平的同时，最大化地释放内容生产力 PGC主要由专业化团队生产较高质量的内容用以商业变现，为保证质量水平，PGC需要投入大量的研发成本，以爱奇艺为例，2021年内容采购成本达207亿元，占总营收的比例高达68%。UGC模式则将用户和创作者一体化，创作者即为用户本身，虽然该模式降低了生产门槛，内容产能大幅上升，但内容质量良莠不齐，例如抖音、快手等短视频平台。尽管UGC在一定程度上突破了PGC的创作瓶颈，但仍然无法满足元宇宙高质量、高产量、多样化的内容需求 AIGC能够突破人工限制，带来元宇宙所需的丰富多元的内容。AIGC通过AI技术自动或辅助生成内容的生产方式，在AI工具帮助下，所有人都可以成为创作者，通过输入指令使AI自动生成内容，让AI去完成冗杂的代码、绘图、建模等任务，在保证一定质量水平的同时，最大程度地降低创作门槛及释放内容生产力，不断拓宽元宇宙内容边界，形成持续膨胀的元宇宙内容库 AIGC行业综述——分类及应用现状按照生成内容的不同，AIGC的应用可分为文本生成、图像生成、音频生成、视频生成和虚拟人生成五大类别，其中当前AIGC的应用以文本生成和图像生成为主 AIGC的分类及应用情况产业链图谱上游：自然语言处理技术上游：智能算法模型中游：商业模式及案例下游：应用场景 AIGC产业链分析——产业链图谱 AIGC产业链上游为基础设施层，主要为提供NLP技术、智能算法模型以及数据库的厂商；中游为内容生产层，主要为通过AIGC生成文字、图像、音视频等内容的厂商；下游为应用层，主要涉及传媒、电商、影视等行业的厂商 AIGC产业链图谱扩散模型使AIGC能够通过文本描述生成各种图像为AIGC模型训练提供海量丰富的素材机之间通过自然语言进行交互的手段文字图像 AIGC生成文字主要被应用于文案的撰写、既定格式的文本撰写以及风格改写 AIGC生成图像在新闻媒体等平台被广泛使用，可有效避免潜在的版权纠纷风险中游·内容生产音频视频虚拟人 AIGC生成音频在地图导航被广泛应用，用户可根据喜好随时切换播报声音 AIGC生成视频是根据文本内容输出相应的视频内容，当前该技术尚未成熟基于视觉、语音、文本生成技术，AIGC打造虚拟主播，用于直播、新闻播报等领域下游·应用场景 AIGC以其真实性、多样性、高效性的特征，有效帮助企业提高内容生产效率，提供更加丰富多元、动态且可交互的内容，或将在传媒、电商、影视、娱乐等数字化程度高的行业率先取得重大创新发展传媒电商影视娱乐直播互联网社交金融教育工业医疗 …… AIGC产业链分析——上游：自然语言处理技术自然语言处理（NLP）技术使计算机能够识别和提取人类语言中的特征与意图，并将计算机的非语言格式数据转换成人类可理解的语言格式，使计算机能够和人类进行自然语言交互，赋能AIGC根据人的语言指令生成相应内容 NLP技术核心任务、语言生成步骤和应用场景两大核心任务自然语言生成六大步骤确定需要传达的信息后，合理组织文本顺序文本结构自然语言理解（NLU）：使计算机和人一样具备正常人的语言理解能力，能够识别和提取语言中的意图在各种信息之间添加连接词输出结构良好的完整句子语言生成语法化自然语言生成（NLG）：将计算机的非语言格式数据转换成人类可以理解的语言格式，如文章、报告等内容确定决定文本所包含的信息句子聚合将多个信息合并到一个句子中参考表达式生成识别内容所属领域（如医学），并使用该领域的词汇四大应用场景语音识别情感分析计算机可识别、理解用户的语音输入信息，并能够从中提取特征值，且能够将用户的语音信息转化为文字信息互联网存在大量的信息，这些信息抒发的情感大致可分为正面和负面的，NLP技术可被用来快速了解用户的情感状态机器翻译聊天机器人识别输入文本的语言及语义，自动生成其他语言版本的文本。机器翻译的准确率在近年大幅提高，部分企业（如youtube）已可做到视频机器翻译 NLP技术赋予聊天机器人感知上下文的能力，能够理解复杂的人类语言，与用户进行对话并执行相关指令 NLP技术使计算机系统能够和人类进行自然语言交互，赋能AIGC根据人的语言指令自动生成目标内容 NLP技术是实现人与计算机之间通过自然语言进行交互的桥梁，融合了语言学、计算机学、数学等学科，使得计算机可以理解人类的自然语言，完成信息提取并进行自动翻译、分析和处理等任务。由于人类语言的复杂性和多样性，NLP技术成熟度一直以来都被视为人机交互落地及场景应用层面的瓶颈。自2018年Transformer模型的问世，其多任务并时处理和大规模训练的能力大幅提升AI的智能化水平，为当前AIGC的高速发展夯实了扎实的技术基础 AIGC产业链分析——中游：商业模式及案例 AIGC商业模式主要根据用户需求自动化生成相应的文本、图像、音视频等内容，主要应用在AI写作、AI绘图、对话式AI等领域；受技术限制，AIGC尚未能够精准满足用户的多种复杂需求，主要作为辅助性工具使用，大部分AIGC平台或软件以免费使用为主，少量业内先进企业的平台采用付费模式 AIGC的商业模式及案例商业模式自动文本生成 Jasper是一款利用AI为博客文章、社交媒体帖子及网页等平台生成文字内容的软件，该软件可以满足用户的各种文字需求，包括拟写博取眼球的标题，改写现有的文字内容以避免剽窃等 AIGC生成文字主要被应用于文案的撰写、既定格式的撰写以及风格改写。用户通过输入一段对于目标文章的描述或要求，系统将会自动抓取数据，根据指令进行创作文字创作文本生成图像依托于百度旗下自研的飞桨和文心跨模态模型，文心·一格是可根据用户文本实现“一键生图”功能的“AI艺术和创意辅助平台”。左图为文心·一格根据输入文本信息“分析师在喝水”自动生成的图像用户输入文字描述，计算机根据文字内容自动生成图像作品；目前在新闻媒体等平台被广泛使用，不仅大幅降低了创作成本，同时避免了潜在的版权纠纷风险图像创作文本生成音频百度地图导航可切换不同明星甚至卡通人物的语音提示；Podcast.ai基于撰写好的文本，使用乔布斯的声音与电台主持人进行了一场长达20分钟的对话基于语言模型和语音库，计算机进行大量的训练后，可用指定的声音说出任何话。用户输入文字描述，设定特定的语境、音色、情感等条件，计算机则根据指令生成相应的音频音频剪辑文本生成视频 Google推出AI视频生成模型Phenaki，其能够根据文本内容生成可变时长视频的技术，在公布的DEMO中，Phenaki用时2分钟生成一段基于几百个单词组成的前后逻辑连贯的视频根据用户输入的文本内容，计算机生成相应的视频。当前该技术仍处于试验阶段，在连贯性与语义理解的准确性方面仍存在明显的缺点视频创作 AIGC产业链分析——下游：应用场景元宇宙背景下，全球加速数字化演进进程，各行业对于数字内容的需求急剧增长。AIGC以其真实性、多样性、高效性的特征，有效帮助企业提高内容生产效率，或将在传媒、电商等数字化程度高的行业率先取得重大创新发展 AIGC应用场景全景图 AIGC产业链分析——应用场景：AIGC+电商在电商领域，AIGC正加速商品3D模型、虚拟主播以及虚拟商城场景的构建，通过结合AR、VR等虚拟技术，大力推进虚实交融的购物场景，实现视听等多感官交互的沉浸式购物，大幅提升消费者的购物体验 AIGC在电商领域的主要应用场景应用案例 2021年4月，天猫上线3D家装城，为商家提供3D设计工具及商品3D模型AI生成服务，帮助商家快速构建3D仿真家具模型，支持消费者进行家装搭配 2021年7月，阿里巴巴首次展示了其虚拟现实计划“Buy+”，并提供360°虚拟购物现场的购物体验欧莱雅、飞利浦、完美日记等品牌的虚拟主播通常在夜间上线并进行直播，与真人直播形成24小时无线衔接的直播服务 Gucci在一百周年品牌庆典时，运用AIGC技术推出了为期两周的虚拟展，并与线下现实展览同步对应海尔集团将海尔兄弟虚拟IP引进直播间，并与支持人、粉丝进行良好的互动优衣库推出虚拟试衣、保时捷推出虚拟试驾等随着数字技术的发展和应用、消费的升级和加快，购物体验沉浸化成为电商领域发展的方向。AIGC正加速商品3D模型、虚拟主播以及虚拟商城场景的构建，通过和AR、VR等新技术的结合，实现视听等多感官交互的沉浸式购物体验 “AIGC+电商”推进虚实交融，大幅提升消费者购物体验在线上购物方面，AIGC可构建商品仿真3D模型，用于商品展示和虚拟适用等场景，大幅提升购物体验。基于不同角度的商品图像，借助视觉生成算法自动化生成商品的仿真3D模型，提供720°全方位展示商品主体外观，同时借助线上虚拟技术，提供“看、试、穿、戴”等功能，以接近线下实物的购物体验助力高效提升用户转化。在直播带货方面，AIGC虚拟主播带来更高的灵活性。基于视觉、语音、文本自动生成技术，AIGC打造虚拟主播为用户提供24小时不间断的商品推介以及在线服务能力，使直播间能够不间断运作，为用户提供更灵活的观看时间和更方便的购物体验。在购物场景方面，AIGC加速融合线上商城与线下卖场，为消费者提供全新的购物场景。基于线下货场的2D图像，AIGC自动化重构线上虚拟3D购物场景，实现虚拟商城的快速、低成本、大批量的构建，有效降低商户搭建3D购物空间的门槛及成本，助力门店加速打造“线上线下融合”的购物场景，为消费者提供更为良好的购物体验相关政策市场规模发展痛点发展趋势竞争格局 = AIGC行业发展——发展痛点 AIGC在数字内容创作方面发挥着愈发重要的作用，但与此同时，AIGC的发展面临着智能算法模型受限、创作技术不够成熟和相关法律法规尚未完善等行业痛点，并引发一系列亟待解决的问题中国AIGC行业发展问题人工智能算法在透明度、鲁棒性、客观性方面存在技术局限透明度方面，由于算法模型的黑箱运作机制，其运作规律和因果逻辑难以摸清与理解，严重阻碍相关技术人员对于错误的输出结果的纠偏鲁棒性方面，算法运算容易受到数据、模型、训练方法等因素干扰，从而输出错误的内容。例如在训练数据量不足的情况下，算法可能受到少量的随机噪音影响，输出错误的内容客观性方面，算法以数据为原料，如果初始数据集带有较严重的主观色彩，这些主观性将会影响算法的运行结果，从而输出非客观的结论 AIGC内容编辑与创作技术不够完善文本生成方面，一般企业在NLP技术上存在瓶颈，通常仅简单地套用模板生成机械化的填充，导致输出文本存在结构雷同、词汇生硬等痛点语音合成方面，语音的情感嵌入的建模难度高以及需要大规模的数据量支持训练，一般企业难以满足其要求，因此业内应用的语音表达不够流畅、声音机械感较强等问题突出视觉生成方面，受技术门槛高、AI视觉同时完成多视觉感知任务的能力不足等限制，面临图像处理效果欠佳，动作捕捉精准度不足等痛点相关规范指引仍待完善，发展与治理存在匹配痛点 AIGC版权有待明确。中国现行的《著作权法》规定著作权的法律主体为人，按照这一逻辑，非人生产的智能化内容难以获得著作权的保护；因此AGC作品面临着著作权归属不清的痛点，这

点击免费查看完整报告