虚拟数字人形态多变分类多元,五大模块组成通用框架。虚拟数字人指存在于非物理世界中,由计算机手段创造及使用,并具有多重人类特征(外貌特征、人类表演能力、交互能力等)的综合产物。虚拟数字人可按人格象征和图形维度划分,亦可根据人物图形维度划分。人物形象、语音生成模块、动画生成模块、音视频合成显示模块、交互模块构成虚拟数字人通用系统框架。 虚拟数字人市场逐步进入成熟期,商业化进程加速。1982年世界第一位虚拟歌姬林明美诞生,虚拟数字人行业经历了萌芽、探索、初级和成长四个阶段。随技术逐年突破,制作过程亦得到有效简化,从最早的手工绘制到现在的CG、人工智能合成。在虚拟数字人产业链中,基础层提供软硬件的支撑; 平台层为制作及开发提供技术;应用层为应用领域提供解决方案,赋能各领域发展。虚拟数字人产业进入门槛高,差异化显著,受众群体不断拓展,因而虚拟数字人价值凸显,应用领域不断拓展,未来有望加速商业化进程。 建模、驱动、渲染三大核心技术为底层架构,多项技术已具有实际应用沉淀。人物建模的主流技术仍为静态扫描,相比静态重建技术,具有高视觉保真度的动态光场三维重建技术成为未来重点发展方向。驱动技术方面,嘴型动作的智能合成已经成功应用于2D和3D虚拟数字人。动作捕捉方案是目前3D数字人动作生成的核心技术,最高可实现毫米级误差。人物渲染方面,PBR渲染技术的进步以及重光照等新型渲染技术的出现使虚拟数字人皮肤纹理变得真实,突破恐怖谷效应。 虚拟数字人应用场景丰富,主力文娱及服务行业。随人工智能应用和发展,虚拟数字人从早期的泛娱乐拓展到金融、文旅、医疗、零售等领域,朝着智能化、便携化、精细化、多样化发展。并实现真实人类虚拟化身的身份职能,逐渐于AI虚拟数字人领域实现商业变现。推荐关注游戏、社交、营销、虚拟偶像等协同效应强板块:1)RPG游戏为游戏市场重点,其对于开放世界设定及对玩家角色的设定要求甚高,龙头厂商多把握成熟虚拟捏人技术;引擎厂商为虚拟数字人市场“卖水人”,提供高精度虚拟人制作平台。2)次时代社交专注沉浸感打造,用户虚拟化身需求提升。3)虚拟数字人KOL已广泛出现在头部平台,其带货效益(市场,形象,口碑)有所彰显。4)2020年中国虚拟偶像核心产业规模为34.6亿元,yoy+70.3%,预计21年达62.2亿元,随虚拟数字人普及度及接受度提升,虚拟偶像市场将进一步扩张。 海内外厂商多角度布局虚拟数字人赛道。国内厂商注重产业链下游的应用及开发,海外厂商聚焦基础层的建设以及AI技术的开发。国内:腾讯、阿里巴巴、网易等综合型厂商支持旗下相关事业部向该赛道发力。娱乐内容关注哔哩哔哩(VUP)以及芒果超媒(虚拟主持人);营销运营关注蓝色光标、乐华娱乐、三人行、浙文互联、平治信息、新华网、捷成股份、引力传媒、华扬联众等;基础层建设关注科大讯飞、追一科技、捷成股份、新华网、三人行等。海外:AI技术关注Soul-Machine、Oben以及Loom.ai;动态捕捉关注VICON、Opti Track、Xsens等;渲染建模关注Epic Games、Unity以及NVIDIA等。因虚拟数字人产业关注度的上升,海内外相关产业的厂商短期内获得多轮融资,大力推动行业高速发展。 投资建议:随元宇宙热潮,虚拟数字人作为先发场景产业备受关注。“五横两纵”形成虚拟数字人基础技术架构,其中建模动态光场技术、光学式和惯性式动捕方案、PBR和重光照渲染为核心技术,Unreal和Unity为主打渲染引擎。应用场景方面,考虑对数字化身的需求提升以及大众对于虚拟数字人接受度改善,游戏、社交、营销、虚拟偶像为重点关注行业。海外关注产业链上游技术厂商,国内推荐关注在产业链中游运营厂商以及下游应用厂商。 风险提示:虚拟数字人技术创新及发展不及预期;用户接受度低于预期;行业政策监管风险;版权管理及保护风险;用户隐私风险 1.名词概览:计算机技术打造虚拟数字人 1.1.定义:数字人、虚拟人、虚拟数字人被赋予特定人物身份 虚拟人、数字人、虚拟数字人的目标是通过计算机图形学技术(Computer Graphic,CG)创造出与人类形象接近的数字化形象,并赋予其特定的人物身份设定,在视觉上拉近和人的心理距离,为人类带来更加真实的情感互动。按照各定义特征的要求,数字人的范畴包含虚拟人,虚拟人的范畴包含虚拟数字人。 图1:数字人、虚拟人和虚拟数字人的关系图 对于不要求必须具备交流互动能力时,数字人、虚拟人、虚拟数字人这三者概念可以认为是等同的。但在严格意义下它们又有细微的差别。虚拟人的身份是虚构的,现实世界中不存在的。数字人强调角色存在于数字世界。虚拟数字人强调虚拟身份和数字化制作特性。 表1:数字人、虚拟人和虚拟数字人对比 虚拟数字人宜具有形象能力、表达能力和感知互动能力三大特征。 表2:虚拟数字人特征表 1.2.划分:人格象征和图形维度是虚拟数字人常见的分类依据 图2:虚拟数字人常见分类 根据人格象征,虚拟数字人可分为虚拟IP和虚拟世界第二分身 表3:虚拟IP和虚拟世界第二分身对比 根据人物图形维度,虚拟数字人可分为2D和3D两大类,从外形上可分为卡通、写实等风格,综合来看可分为二次元、3D卡通、3D超写实、真人形象四种类型。 表4:二次元、3D卡通、3D超写实、真人形象对比 1.3.框架:五大模块构成虚拟数字人通用系统框架 人物形象根据人物图形资源的维度,可分为2D和3D两大类;语音和动画生成模块可分别基于文本生成对应的人物语音以及人物动画;音视频合成显示模块将语音和动画合成视频;交互模块根据语音语义识别用户的意图,并决定数字人后续的语音和动作。 图3:虚拟数字人通用系统框架 交互模块为扩展项,根据其有无,可将数字人分为交互型数字人和非交互型数字人。 非交互型虚拟数字人系统依据目标文本生成对应的人物语音及动画,并合成音视频呈现给用户。 图4:非交互类虚拟数字人系统运作流程 交互型数字人根据驱动方式的不同可分为智能驱动型和真人驱动型。 1)智能驱动型数字人可通过智能系统自动读取并解析识别外界输入信息,根据解析结果决策数字人后续的输出文本,然后驱动人物模型生成相应的语音与动作来使数字人跟用户互动。该人物模型是预先通过AI技术训练得到的,可通过文本驱动生成语音和对应动画,业内将此模型称为TTSA(Text To Speech & Animation)人物模型。 2)真人驱动型数字人则是通过真人来驱动数字人,主要原理是真人根据视频监控系统传来的用户视频,与用户实时语音,同时通过动作捕捉采集系统将真人的表情、动作呈现在虚拟数字人形象上,从而与用户进行交互。 图5:智能驱动型虚拟数字人运作流程图 图6:真人驱动型虚拟数字人运作流程 2.行业情况分析:虚拟数字人市场广阔,应用领域不断拓展 2.1.行业沿革:虚拟数字人已处高速成长阶段 虚拟数字人从最早的手工绘制到现在的CG(Computer Graphics,电脑绘图)、人工智能合成,虚拟数字人大致经历了萌芽、探索、初级和成长四个阶段 图7:虚拟数字人发展沿革 2.2.产业链:随理论技术日益成熟,商业模式持续演进丰富产业链 当前虚拟数字人理论和技术日益成熟,应用范围不断扩大,产业正在逐步形成、不断丰富,相应的商业模式也在持续演进和多元化。 图8:虚拟数字人产业链视图 2.2.1.基础层:厂商深耕软硬件行业,具有深厚技术壁垒 基础层为虚拟数字人提供基础软硬件支撑,硬件包括显示设备、光学器件、传感器、芯片等,基础软件包括建模软件、渲染引擎。显示设备是数字人的载体,既包括手机、电视、投影、LED显示等2D显示设备,也包括裸眼立体、AR、VR等3D显示设备。光学器件用于视觉传感器、用户显示器的制作。传感器用于数字人原始数据及用户数据的采集。 芯片用于传感器数据预处理和数字人模型渲染、AI计算。建模软件能够对虚拟数字人的人体、衣物进行三维建模。渲染引擎能够对灯光、毛发、衣物等进行渲染,主流引擎包括Unity Technologies公司的Unity 3D、Epic Games公司的Unreal Engine等。总体来看,处于基础层的厂商已经深耕行业多年,已经形成了较为深厚的技术壁垒。 图9:虚拟数字人产业链基础层概览 2.2.2.平台层:提供多元技术支持,赋予虚拟数字人真实及灵动感 平台层包括软硬件系统、生产技术服务平台、AI能力平台,为虚拟数字人的制作及开发提供技术能力。建模系统和动作捕捉系统通过产业链上游的传感器、光学器件等硬件获取真人/实物的各类信息,利用软件算法实现对人物的建模、动作的重现;渲染平台用于模型的云端渲染。解决方案平台基于自身技术能力为广大客户提供数字人解决方案。AI能力平台提供计算机视觉、智能语音、自然语言处理技术能力。平台层汇聚的企业较多,腾讯、百度、搜狗、魔珐科技、相芯科技均有提供相应数字人技术服务平台。 图10:全球人工智能技术发展阶段 2.2.3.应用层:带领虚拟数字人切入商业化赛道 应用层是指虚拟数字人技术结合实际应用场景领域,切入各类,形成行业应用解决方案,赋能行业领域。按照应用场景或行业的不同,已经出现了娱乐型数字人(如虚拟主播、虚拟偶像)、教育型数字人(如虚拟教师)、助手型数字人(如虚拟客服、虚拟导游、智能助手)、影视数字人(如替身演员或虚拟演员)等。不同外形、不同功能的虚拟数字人赋能影视、传媒、游戏、金融、文旅等领域,根据需求为用户提供定制化服务。 表5:虚拟数字人应用领域、场景及充当角色 2.3.政策:近期多项政策推动虚拟数字人新兴科技产业发展 表6:国家相关支持政策 2.4.行业趋势:优质技术仍待普及,受众群体仍待拓展 虚拟数字人产业生产及运营成本高,优劣差异化显著,受众群体不断拓展,因而虚拟数字人价值凸显,应用领域不断拓展,未来有望加速商业化进程。 图11:虚拟数字人产业发展趋势 采集制作流程简单化、一体化,迭代式提升真实感 未来虚拟数字人制作技术将更加简单,更加一体化、自动化设备同步获取模型、身体、表情等所有数据,无需穿戴专业传感设备。 交互方式衍变,智能化程度不断加深 全双工技术将推进数字人交互方式的演变,使得数字人拥有一次唤醒、多次交互能力﹐具备实时智能响应、只能打断、智能纠错、多轮对话等功能。 实现多场景、多领域的融合、应用及落地 目前虚拟数字人发展环境整体情况还处于未成熟的起步阶段,随着虚拟数字人技术的精进和市场价值的释放,将更深入地融入影视、金融、文旅等各个领域。 虚拟数字人目前仍处于孵化培育阶段,以企业服务为形式的2B2C服务为重点。未来驱动力包括代际变化、技术门槛降低、虚拟化趋势、VR设备回暖等原因。在各行业逐渐意识到其技术可行性和商业价值后,虚拟数字人行业将有望快速进入高速发展期。 图12:发展趋势 3.技术架构:建模、驱动、渲染三大关键技术构成底层架构 虚拟数字人基础技术架构包括“五横两纵”。“五横”是指用于数字人制作、交互的五大技术模块,即人物生成、人物表达、合成显示、识别感知、分析决策等模块。其中,人物生成,即人物建模方面2D数字人较为简单,3D数字人需要额外使用三维建模技术。人物表达包括语音生成和动画生成。动画生成则包含驱动和渲染两大部分。“两纵”是指2D、3D数字人,2D数字人和3D数字人在技术架构方面基本一致。3D数字人需要额外使用三维建模技术生成数字形象,信息维度增加,所需的计算量更大。 表7:五横两纵 3.1.建模:主流技术仍为静态扫描,动态光场成为未来重点发展方向 建模技术分为静态扫描建模和动态光场重建,目前主流技术仍为静态扫描,相比静态重建技术,具有高视觉保真度的动态光场三维重建技术不仅可以重建人物的几何模型,还可一次性获取动态的人物模型数据,并高品质重现不同视角下观看人体的光影效果,成为数字人建模重点发展方向。 静态扫描建模技术 静态扫描建模技术可分为结构光扫描重建和相机阵列扫描重建,结构光扫描重建扫描时间长,对于人体这类运动目标在友好度和适