2023年中国AI驱动虚拟数字人行业词条报告 作者 摘要 陈文广 行业头豹分类/综合及概念/元宇宙/数字人底层人技术/软件技术港股分类法港股分类法/服务/影视传媒 关键词虚拟人元宇宙AI技术互联网科技企业AI驱动数字人 AI驱动虚拟数字人指通过AI技术“一站式”实现的虚拟人的创建、驱动和内容生成,使其具备感知、表达等无需人工干预的自动交互能力,相对于由真人驱动的虚拟数字人,AI驱动虚拟数字人更加注重多模态技术和深度学习。其发展过程可总结为技术探索、产业融合和多模态发展三个阶段,是用户需求与技术升级融合的结果。AI驱动虚拟数字人厂商依据提供服务的不同可分为AI类厂商、CG/XR生产技术类厂商、互联网/综合类厂商以及垂直虚拟人厂商,技术成熟的AI类科技公司在客户积累、资金链、销售渠道和技术实力方面具有明显优势。 1.AI驱动虚拟数字人行业定义 AI驱动即表示通过深度学习算法,形成面部表情、口型动作和语音表达相应的驱动模型与驱动方式。AI驱动虚拟数字人即通过智能系统自动读取并解析识别外界输入信息,根据结果决策数字人后续的输出文本,驱动人物模型生成相应的语音与动作,跟用户进行交互。AI驱动虚拟数字人在外表、行为和交互等方面拥有拟人化的特征,也可实现超人类的行动,包括拥有特定的形貌,性别和性格等人物特征,具有用语言、面部表情和肢体动作表达的能力,可实现基本的语音驱动、语义理解、对话沟通等过程,同时拥有情感表达、情绪交流、性格培养等高阶能力. 虚拟数字人分类 2. 根据是否具备交互模块,虚拟数字人可分为交互型虚拟数字人与非交互型虚拟数字人,其中交互型虚拟数字人又可分为真人驱动型虚拟数字人与AI驱动型虚拟数字人。 AI驱动虚拟数字人行业特征 不具备交互模块,系统根据目标文本生成对应的任务语音及动画,并合成音视频呈现给用户 非交互型虚拟数字人 通过真人来驱动虚拟数字人,真人通过视频监控系统传来的用户视频、与用户实时语音,同时通过动作捕捉采集系统将真人的表情、动作呈现在虚拟数字人形象中,与用户进行交互 交互型:真人驱动型虚拟数字人 通过智能系统自动读取并解析识别外界输入信息,根据结果决策数字人后续的输出文本,驱动人物模型生成相应的语音与动作,使数字人跟用户互动 交互型:AI驱动型虚拟数字人 类型名称类型说明 3. AI驱动数字虚拟人行业发展仍处于起步阶段,其技术流程主要基于AI技术,服务模式可分为定制化和平台化两种模式,以及下游厂商在采购时会参考厂商的AI技术实力、场景落地能力等因素。 形象设计及驱动数据采集-形象建模并进行绑定-训练驱动模型-基于输入或转化的语音进行内容制作-渲染并生成内容 第一步:利用多方位摄像头,对模特进行打点扫描(视最终需求可进行全身或局部扫描),采集其说话时的唇动、表情、面部肌肉变化细节、姿态等数据;第二步:利用多方位摄像头,对模特进行打点扫描(视最终需求可进行全身或局部扫描),采集其说话时的唇动、表情、 技术流程面部肌肉变化细节、姿态等数据;第三步,决定最终效果的核心步骤,利用深度学习,学习模特语音、唇形、表情参数间的潜在映射关系,高度还原人脸骨骼和肌肉的细微变化,得到逼真的表情驱动模型;第四步,核心的技术流程是基于输入的语音,或首先基于TTS技术,将输入的文本转化为语音。基于语音,结合驱动模型,并利用生成对抗模型GAN选出最符合现实的图片,推理得到每帧数字人的图片;第五步,计算框架的大小、算力供给等技术问题会影响渲染效果 AI驱动虚拟人厂商服务模式可分为定制化和平台化两种模式 在虚拟数字人行业发展前期,厂商服务模式以企业定制为主,客户结合业务需求向AI类厂商或CG/XR等技术厂商定制相关服务。随着AI技服务模式术的突破和算法模型在学术界的公开,涌现出一批提供“全栈式”虚拟数字人开发服务的垂直类厂商,搭建AI驱动虚拟数字人生产、内容创作、业务配置于一体的开发平台,在模版虚拟人的基础上提供部分定制服务,这种模式的供应商包括AI技术壁垒深厚的头部AI类厂商、产 品研发和运营经验丰富的综合类厂商以及外包技术服务的渠道厂商。 企业在采购虚拟数字人时会参考厂商的AI技术实力、场景落地能力、所提供的后期运维服务和企业自身的报价预算,同时也倾向于选择熟悉的技术厂商进行合作 企业在选择虚拟数字人厂商时主要会考量以下几个因素:首先是厂商的技术实力(优先考虑头部技术厂商,或者厂商是否完成过头部企业的项目)、报价预算、虚拟数字人后期运维服务(技术升级或技能配置更新),以及厂商和企业之间既定的互信合作关系(例如在银行 厂商偏好业,人工智能服务涉及商业数据或客户隐私,企业倾向于交由熟悉的外包公司,而不是头部技术厂商来完成)。除此之外,据专家称,业 内头部厂商在人像驱动、智能对话和语音交互等技术领域并无较大差距,差异化主要集中在以下两个方面:首先是知识图谱,虚拟偶像、虚拟带货主播、虚拟银行客服、虚拟财务员工和虚拟医生等不同场景下应用的知识图谱各不相同,同一场景下不同业务涉及的知识库也存在差异;以金融业为例,要求虚拟数字人厂商沉淀丰富的业务场景能力,针对金融企业的营销、风控、客服等场景均具备成熟的产品方案能力;其次是上文提到的厂商和企业之间先行的互信合作关系,具体服务流程为:客户向信赖的厂商提出需求,确定虚拟数字人的形象、功能、任务框架和知识图谱,由厂商进行后续的开发。 AI驱动虚拟数字人发展历程 4. AI驱动虚拟人发展可总结为技术探索、产业融合和多模态发展三个阶段,其发展是用户需求与技术升级融合的结果,当前行业处于多模式发展阶段;在成熟的AI技术加持下,人工智能的加持使虚拟人能够满足越来越多元的场景需求 开始时间:2010结束时间:2015阶段:萌芽期 行业动态:全球首个虚拟主播“绊爱”:2016年12月1日,绊爱开设了自己的Youtube频道并发布第一个视频,被人们公认为“首个虚拟主播”、“虚拟主播的探索者和先行者” 行业影响/ 阶段特征:虚拟人技术探索阶段,该阶段标志着虚拟数字人开始进入影视娱乐行业,将为影视娱乐行业带来颠覆性的改变,但当前虚拟人的发展仍处于萌芽阶段,其市场规模尚未打开,并且CG技术、动作捕捉技术、语音合成技术尚未成熟 开始时间:2015结束时间:2020阶段:启动期 行业动态:全球首个全仿真智能AI主持人:2018年,新华社与搜狗联合发布“AI合成主播”;银行业首位数字员工:2019年,浦发银行和百度共同发布数字员工“小浦”,为用户进行产品讲解、业务办理、资讯播报 行业影响/ 阶段特征:产业融合阶段,人工智能成为虚拟数字人不可分割的工具,与金融、文旅、快消等产业快速融合;标志着AI技术已渗透进入多元产业当中 开始时间:2020结束时间:2022阶段:高速发展期 行业动态:中国气象局联合小冰公司共同打造的虚拟主持人“冯小殊”:依托小冰数字孪生虚拟人技术构建及小样本学习技术,训练周期仅一周,抖音虚拟美妆达人“柳夜熙”:2021年10月31日“柳夜熙”上线,仅3天涨粉230万,首发视频超过250万点击 行业影响/ 阶段特征:多模式发展阶段,该阶段融合语音、图片、视频等多模态元素的开放域人机对话大幅提升对话内容和形式的丰富程度,同时超级自然语音技术用于虚拟人产品运作,虚拟人声音自然度大幅提升 虚拟数字人行业产业链分析 5. 虚拟数字人产业链上游是形象设计与塑造类,以及制作工具相关的厂商,中游主要是AI厂商与互联网企业,下游主要是泛娱乐、政企服务以及品牌服务类企业。在上游环节,3D虚拟数字人制作成本较高,前期设计成本高达数十万至数百万元,加上后续电脑、动作捕捉系统等设备仍需数万元至数十万元的投入;在中游环节,主要为AI厂商和互联网企业,当前AI技术作为虚拟数字人行业核心驱动力量,已成为各国经济发展新引擎。目前人工智能技术正加速与实体经济深度融合,助力产业转型升级;以BAT为首的AI+互联网企业正在虚拟数字人行业着力布局,预计未来将陆续推出爆款产品;在下游环节,从细分领域分析,早期虚拟人落地产业主要集中在影视、游戏以及动漫领域,呈现“高成本、高壁垒、长周期”的特征,主要系早期技术未实现质的突破,虚拟人制作成本高、周期长等因素致使行业进入壁垒高。得益于AI技术的稳步突破,自2020年起,虚拟人稳步渗透进入下游金融、零售、医疗、影视、游戏、文旅等行业。 中国虚拟数字人行业市场规模 中国平安、中国银联、浦发银行、光大银行、爱奇艺、抖音、人民网、虎牙直播、新华网、腾讯 、网易、阿里巴巴 从细分的应用行业看,虚拟数字人产业发展与下游应用需求紧密相关,主要客群涉及泛娱乐、金融、零售、文旅、教育和办公协同等领域;早期主要客群集中于影视和游戏等泛娱乐领域,后随着感知智能技术的突破,虚拟数字人与各行各业相结合的趋势和价值逐步显现。从应用场景看,虚拟数字人应用正在给传统行业带来革命性的改变,虚拟数字人技术、产品与不同行业相结合,与人们生产生活相融合,其规模化、可定制化、可复制化的能力改善传统环节流程,提升效能与降低成本等,大幅提升业务效率,增强用户体验感 泛娱乐行业、政企服务类、品牌服务类 科大讯飞、字节跳动、商汤科技、百度智能云、腾讯云、网易伏羲、小冰、旷视科技、Microsoft 、小米、相芯科技、凌云光 AI技术作为虚拟数字人行业核心驱动力量,已成为各国经济发展新引擎。目前人工智能技术正加速与实体经济深度融合,助力产业转型升级。经过多年积累,中国在人工智能领域取得突破性的进展,人工智能理论和技术日益成熟,应用范围不断扩大,全产业链逐步形成,商业模式也逐步推进成熟;2020年中国人工智能相关产业规模超万亿,其中黑犀牛产业规模已达3251亿元 AI厂商、互联网技术厂商 DigitalDomain、Microsoft、阅文集团、Autodesk 、Intel、青瞳视觉、Houdini、brud、Datagrid、 Xsens 从制作成本方面看,3D虚拟数字人制作成本高昂,制约着虚拟人行业发展。根据呈现方式不同,虚拟数字人可分为2D和3D数字人,二者制作流程均相对简单,主要包括虚拟形象构思,对虚拟形象进行美术加工,建模绑定等;但3D虚拟数字人制造成本相对高昂,前期成本投入可高达数十万至数百万元,加上后续电脑、动作捕捉系统等设备仍需数万元至数十万元的投入。未来随着AR、VR技术,以及虚拟软件和设备的日趋成熟,虚拟人制作成本将逐步下降,将会有更多的厂商参与其中,虚拟人的创作也将蓬勃发展,从以往影视行业逐步拓展至千行百业 形象设计与制作工具 下游环节下游说明下游参与方 中游环节中游说明中游参与方 上游环节上游说明上游参与方 6. 中国虚拟数字人行业从2020年开始进入高速发展阶段,其市场规模由2017年的49.8亿元快速增长至2021年的156.2亿元,主要原因为受疫情影响,线上办公、线上教育、线上娱乐等数字化产业的市场需求剧增,市场资本已意识到数字化、线上化发展是当前及未来的主要发展趋势,以虚拟数字人为代表的数字化行业进入快速扩张的高速发展阶段。当前元宇宙整体技术与生态配套等尚未成熟,虚拟数字人主要应用于音视频等泛娱乐行业,且渗透率不高,底层技术不够成熟导致费用高昂且无法收获较好的成效,未来随着AI技术的不断进步,以及应用场景渗透率不断提升,虚拟数字人的应用场景将更加广泛,且渗透率更高,预计至2026年,中国虚拟数字人的市场规模将达到1231.5亿元。 中国虚拟数字人行业规模,2017-2026年预测 市场规模=中国金融行业营收规模*虚拟数字人渗透率+中国音视频行业营收规模*虚拟数字人渗透率+中国游戏行业收入规模*虚拟数字人渗透率+中国文旅行业收入规模*虚拟数字人渗透率+中国教育行业收入规模*虚拟数字人渗透率 7.中国虚拟数字人政策梳理 中国人工智能产业发展联盟,量子位,头豹研究院 政策名称:《关于促进文化和科技深度融合的指导意见》颁布主体:科技部等六部门生效日期:2019-08影响:7政策性质:指导性政策 政策内容:促进数字经济发展。加强数字中国建设整体布局。完善数字经济治理,培育数据要素