您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[头豹研究院]:2022年中国AIGC行业研究报告: 蓄势待发,数字内容的工业革命(摘要版) - 发现报告
当前位置:首页/行业研究/报告详情/

2022年中国AIGC行业研究报告: 蓄势待发,数字内容的工业革命(摘要版)

信息技术2023-04-06头豹研究院机构上传
2022年中国AIGC行业研究报告: 蓄势待发,数字内容的工业革命(摘要版)

行业背景:热点事件 定义及内涵 发展历程 分类及应用现状 AIGC行业综述——定义与内涵 AIGC是基于人工智能技术自动生成数字内容,如文本、图谱、音视频等; 与PGC和UGC模式相比,AIGC的优势在于能够突破人力创作的限制,在保证一定质量水平的同时,最大程度地降低创作门槛及释放内容生产力 PGC、UGC和AIGC的产能及生产效率 内容产量 受AI技术成熟度所限 受内容质量所限 AlGC 元宇宙的重要基础设施 PGC和UGC分别被产能和质量所限制,AIGC在保证一定质量水平的同时,最大化地释放内容生产力 PGC主要由专业化团队生产较高质量的内容用以商业变现,为保证质量水平,PGC需要投入大量的研发成本,以爱奇艺为例,2021年内容采购成本达207亿元,占总营收的比例高达68%。UGC模式则将用户和创作者一体化,创作者即为用户本身,虽然该模式降低了生产门槛,内容产能大幅上升,但内容质量良莠不齐,例如抖音、快手等短视频平台。尽管UGC在一定程度上突破了PGC的创作瓶颈,但仍然无法满足元宇宙高质量、高产量、多样化的内容需求 AIGC能够突破人工限制,带来元宇宙所需的丰富多元的内容。AIGC通过AI技术自动或辅助生成内容的生产方式,在AI工具帮助下,所有人都可以成为创作者,通过输入指令使AI自动生成内容,让AI去完成冗杂的代码、绘图、建模等任务,在保证一定质量水平的同时,最大程度地降低创作门槛及释放内容生产力,不断拓宽元宇宙内容边界,形成持续膨胀的元宇宙内容库 AIGC行业综述——分类及应用现状 按照生成内容的不同,AIGC的应用可分为文本生成、图像生成、音频生成、视频生成和虚拟人生成五大类别,其中当前AIGC的应用以文本生成和图像生成为主 AIGC的分类及应用情况 产业链图谱 上游:自然语言处理技术 上游:智能算法模型 中游:商业模式及案例 下游:应用场景 AIGC产业链分析——产业链图谱 AIGC产业链上游为基础设施层,主要为提供NLP技术、智能算法模型以及数据库的厂商;中游为内容生产层,主要为通过AIGC生成文字、图像、音视频等内容的厂商;下游为应用层,主要涉及传媒、电商、影视等行业的厂商 AIGC产业链图谱 扩散模型使AIGC能够通过文本描述生成各种图像 为AIGC模型训练提供海量丰富的素材 机之间通过自然语言进行交互的手段 文字 图像 AIGC生成文字主要被应用于文案的撰写、既定格式的文本撰写以及风格改写 AIGC生成图像在新闻媒体等平台被广泛使用,可有效避免潜在的版权纠纷风险 中游·内容生产 音频 视频 虚拟人 AIGC生成音频在地图导航被广泛应用,用户可根据喜好随时切换播报声音 AIGC生成视频是根据文本内容输出相应的视频内容,当前该技术尚未成熟 基于视觉、语音、文本生成技术,AIGC打造虚拟主播,用于直播、新闻播报等领域 下游·应用场景 AIGC以其真实性、多样性、高效性的特征,有效帮助企业提高内容生产效率,提供更加丰富多元、动态且可交互的内容,或将在传媒、电商、影视、娱乐等数字化程度高的行业率先取得重大创新发展 传媒 电商 影视 娱乐 直播 互联网 社交 金融 教育 工业 医疗 …… AIGC产业链分析——上游:自然语言处理技术 自然语言处理(NLP)技术使计算机能够识别和提取人类语言中的特征与意图,并将计算机的非语言格式数据转换成人类可理解的语言格式,使计算机能够和人类进行自然语言交互,赋能AIGC根据人的语言指令生成相应内容 NLP技术核心任务、语言生成步骤和应用场景 两大核心任务 自然语言生成六大步骤 确定需要传达的信息后,合理组织文本顺序文本结构 自然语言理解(NLU): 使计算机和人一样具备正常人的语言理解能力,能够识别和提取语言中的意图 在各种信息之间添加连接词 输出结构良好的完整句子 语言生成 语法化 自然语言生成(NLG): 将计算机的非语言格式数据转换成人类可以理解的语言格式,如文章、报告等 内容确定决定文本所包含的信息 句子聚合将多个信息合并到一个句子中 参考表达式生成识别内容所属领域(如医学),并使用该领域的词汇 四大应用场景 语音识别 情感分析 计算机可识别、理解用户的语音输入信息,并能够从中提取特征值,且能够将用户的语音信息转化为文字信息 互联网存在大量的信息,这些信息抒发的情感大致可分为正面和负面的,NLP技术可被用来快速了解用户的情感状态 机器翻译 聊天机器人 识别输入文本的语言及语义,自动生成其他语言版本的文本。机器翻译的准确率在近年大幅提高,部分企业 (如youtube)已可做到视频机器翻译 NLP技术赋予聊天机器人感知上下文的能力,能够理解复杂的人类语言,与用户进行对话并执行相关指令 NLP技术使计算机系统能够和人类进行自然语言交互,赋能AIGC根据人的语言指令自动生成目标内容 NLP技术是实现人与计算机之间通过自然语言进行交互的桥梁,融合了语言学、计算机学、数学等学科,使得计算机可以理解人类的自然语言,完成信息提取并进行自动翻译、分析和处理等任务。由于人类语言的复杂性和多样性,NLP技术成熟度一直以来都被视为人机交互落地及场景应用层面的瓶颈。自2018年Transformer模型的问世,其多任务并时处理和大规模训练的能力大幅提升AI的智能化水平,为当前AIGC的高速发展夯实了扎实的技术基础 AIGC产业链分析——中游:商业模式及案例 AIGC商业模式主要根据用户需求自动化生成相应的文本、图像、音视频等内容,主要应用在AI写作、AI绘图、对话式AI等领域;受技术限制,AIGC尚未能够精准满足用户的多种复杂需求,主要作为辅助性工具使用,大部分AIGC平台或软件以免费使用为主,少量业内先进企业的平台采用付费模式 AIGC的商业模式及案例 商业模式 自动文本生成 Jasper是一款利用AI为博客文章、社交媒体帖子及网页等平台生成文字内容的软件,该软件可以满足用户的各种文字需求,包括拟写博取眼球的标题,改写现有的文字内容以避免剽窃等 AIGC生成文字主要被应用于文案的撰写、既定格式的撰写以及风格改写。用户通过输入一段对于目标文章的描述或要求,系统将会自动抓取数据,根据指令进行创作 文字创作 文本生成图像 依托于百度旗下自研的飞桨和文心跨模态模型,文心·一格是可根据用户文本实现“一键生图”功能的“AI艺术和创意辅助平台”。左图为文心·一格根据输入文本信息“分析师在喝水”自动生成的图像 用户输入文字描述,计算机根据文字内容自动生成图像作品;目前在新闻媒体等平台被广泛使用,不仅大幅降低了创作成本,同时避免了潜在的版权纠纷风险 图像创作 文本生成音频 百度地图导航可切换不同明星甚至卡通人物的语音提示;Podcast.ai基于撰写好的文本,使用乔布斯的声音与电台主持人进行了一场长达20分钟的对话 基于语言模型和语音库,计算机进行大量的训练后,可用指定的声音说出任何话。用户输入文字描述,设定特定的语境、音色、情感等条件,计算机则根据指令生成相应的音频 音频剪辑 文本生成视频 Google推出AI视频生成模型Phenaki,其能够根据文本内容生成可变时长视频的技术,在公布的DEMO中,Phenaki用时2分钟生成一段基于几百个单词组成的前后逻辑连贯的视频 根据用户输入的文本内容,计算机生成相应的视频。当前该技术仍处于试验阶段,在连贯性与语义理解的准确性方面仍存在明显的缺点 视频创作 AIGC产业链分析——下游:应用场景 元宇宙背景下,全球加速数字化演进进程,各行业对于数字内容的需求急剧增长。AIGC以其真实性、多样性、高效性的特征,有效帮助企业提高内容生产效率,或将在传媒、电商等数字化程度高的行业率先取得重大创新发展 AIGC应用场景全景图 AIGC产业链分析——应用场景:AIGC+电商 在电商领域,AIGC正加速商品3D模型、虚拟主播以及虚拟商城场景的构建,通过结合AR、VR等虚拟技术,大力推进虚实交融的购物场景,实现视听等多感官交互的沉浸式购物,大幅提升消费者的购物体验 AIGC在电商领域的主要应用场景 应用案例 2021年4月,天猫上线3D家装城,为商家提供3D设计工具及商品3D模型AI生成服务,帮助商家快速构建3D仿真家具模型,支持消费者进行家装搭配 2021年7月,阿里巴巴首次展示了其虚拟现实计划“Buy+”,并提供360°虚拟购物现场的购物体验 欧莱雅、飞利浦、完美日记等品牌的虚拟主播通常在夜间上线并进行直播,与真人直播形成24小时无线衔接的直播服务 Gucci在一百周年品牌庆典时,运用AIGC技术推出了为期两周的虚拟展,并与线下现实展览同步对应 海尔集团将海尔兄弟虚拟IP引进直播间,并与支持人、粉丝进行良好的互动 优衣库推出虚拟试衣、保时捷推出虚拟试驾等 随着数字技术的发展和应用、消费的升级和加快,购物体验沉浸化成为电商领域发展的方向。AIGC正加速商品3D模型、虚拟主播以及虚拟商城场景的构建,通过和AR、VR等新技术的结合,实现视听等多感官交互的沉浸式购物体验 “AIGC+电商”推进虚实交融,大幅提升消费者购物体验 在线上购物方面,AIGC可构建商品仿真3D模型,用于商品展示和虚拟适用等场景,大幅提升购物体验。基于不同角度的商品图像,借助视觉生成算法自动化生成商品的仿真3D模型,提供720°全方位展示商品主体外观,同时借助线上虚拟技术,提供“看、试、穿、戴”等功能,以接近线下实物的购物体验助力高效提升用户转化。在直播带货方面,AIGC虚拟主播带来更高的灵活性。基于视觉、语音、文本自动生成技术,AIGC打造虚拟主播为用户提供24小时不间断的商品推介以及在线服务能力,使直播间能够不间断运作,为用户提供更灵活的观看时间和更方便的购物体验。在购物场景方面,AIGC加速融合线上商城与线下卖场,为消费者提供全新的购物场景。基于线下货场的2D图像,AIGC自动化重构线上虚拟3D购物场景,实现虚拟商城的快速、低成本、大批量的构建,有效降低商户搭建3D购物空间的门槛及成本,助力门店加速打造“线上线下融合”的购物场景,为消费者提供更为良好的购物体验 相关政策 市场规模 发展痛点 发展趋势 竞争格局 = AIGC行业发展——发展痛点 AIGC在数字内容创作方面发挥着愈发重要的作用,但与此同时,AIGC的发展面临着智能算法模型受限、创作技术不够成熟和相关法律法规尚未完善等行业痛点,并引发一系列亟待解决的问题 中国AIGC行业发展问题 人工智能算法在透明度、鲁棒性、客观性方面存在技术局限 透明度方面,由于算法模型的黑箱运作机制,其运作规律和因果逻辑难以摸清与理解,严重阻碍相关技术人员对于错误的输出结果的纠偏 鲁棒性方面,算法运算容易受到数据、模型、训练方法等因素干扰,从而输出错误的内容。例如在训练数据量不足的情况下,算法可能受到少量的随机噪音影响,输出错误的内容 客观性方面,算法以数据为原料,如果初始数据集带有较严重的主观色彩,这些主观性将会影响算法的运行结果,从而输出非客观的结论 AIGC内容编辑与创作技术不够完善 文本生成方面,一般企业在NLP技术上存在瓶颈,通常仅简单地套用模板生成机械化的填充,导致输出文本存在结构雷同、词汇生硬等痛点 语音合成方面,语音的情感嵌入的建模难度高以及需要大规模的数据量支持训练,一般企业难以满足其要求,因此业内应用的语音表达不够流畅、声音机械感较强等问题突出 视觉生成方面,受技术门槛高、AI视觉同时完成多视觉感知任务的能力不足等限制,面临图像处理效果欠佳,动作捕捉精准度不足等痛点 相关规范指引仍待完善,发展与治理存在匹配痛点 AIGC版权有待明确。中国现行的《著作权法》规定著作权的法律主体为人,按照这一逻辑,非人生产的智能化内容难以获得著作权的保护; 因此AGC作品面临着著作权归属不清的痛点,这