虚拟人产业受技术与需求驱动,拟人化是重要发展方向:虚拟人可分为功能型与身份型虚拟人,功能型虚拟人主要以替代日常工作为主要目的; 身份型虚拟人以IP形象为特征,是认知与需求的投射,市场空间更广阔。虚拟人已进入快速成长期,AI大背景下虚拟人产业从基础层、平台层、应用层到交互层均迎来较大变革,传统虚拟人已过渡至AI虚拟人时期,根据艾媒咨询数据,到2025年虚拟人核心市场规模有望达到480.6亿元。 AI推动虚拟人降本增效,交互能力提升,技术、应用、商业化良性循环:AI与虚拟人产业结合度持续提升,AI逐步实现虚拟人制作全流程覆盖,虚拟人制作降本增效,AI建模、驱动替代传统的CG建模与中之人驱动;虚拟人接入大模型大幅提升虚拟人多模态交互能力,应用场景持续拓展。AI带来降本增效,打开虚拟人行业商业化空间,应用场景拓展进一步丰富虚拟人产业的商业模式,AI虚拟人产业有望实现商业化、技术进步、应用拓展良性循环。 AI驱动虚拟人应用场景加速拓展,细分赛道有望受益于AI赋能:随着AI等技术进步对虚拟人形象与交互能力的提升,AI能够在更多场景替代人力。广告营销领域,虚拟人通过第三方合作与品牌自有的形式提升营销效果;直播电商领域,AI数字人替代真人直播,直播时长大幅提升;陪伴场景下,虚拟人交互能力提升,能够满足人的情感需求;泛娱乐场景下,数字人拟人化程度提升,能够参与泛娱乐活动,实现与真人交互。 投资建议:我们认为,“AI+虚拟人”有望持续演进,建议关注:AI产业链标的捷成股份、天娱数科、万兴科技;细分应用赛道:广告营销(蓝色光标、三人行)、陪伴场景(盛天网络、中文在线)、直播电商(遥望科技); 具备IP储备与孵化能力的标的:奥飞娱乐、华策影视、芒果超媒等。 风险提示:AI产业发展不及预期;应用端推进不及预期;政策监管趋严; 行业竞争加剧等 1虚拟数字人受技术与需求驱动,以拟人化为发展方向 虚拟数字人行业发展主要受技术驱动和需求指引,核心是拟人化。虚拟人物在现实生活中表现出与人的互动性,是数字虚拟人区别于影视作品形象的重要特征。 虚拟人的发展方向在于交互能力的提升和形象呈现的进步,拟人化是发展的核心,表现为对真人的替代能力。虚拟人发展不同阶段应用受制于技术水平,AI时代应用端有望迎来全面催化。 20世纪80年代前后是虚拟人的萌芽期,虚拟人物开始进入现实世界,日本打造了世界首位虚拟歌姬林明,英国人GeorgiaStone创作出虚拟人物Max参演电影、拍摄广告。 21世纪初,建模、动捕等技术的革新推动虚拟人产业进步,演员动捕结合CG合成的虚拟人物应用至影视行业。 随着Z世代群体对AGC内容需求的增加,身份型虚拟人认可度提升,虚拟偶像走向大众。 近年来深度学习算法、硬件设备进步,数字虚拟人的拟人化水平得到提升,语音表达、语义理解及对话能力提升,功能型虚拟人的应用得到推广。 进入AI时代,大模型赋能虚拟人产业全链,推动虚拟人产业降本增效、交互能力提升,应用端场景拓展空间广阔。 图1.虚拟人发展历程 AI虚拟人产业链包含基础层、平台层、价值层、交互层。 底层软硬件水平是决定AI数字人发展的技术基础:传统CG技术、人工智能技术是主要的软件基础,通用设施技术提供重要的硬件载体。 AIGC赋能平台层,降低数字人开发门槛,推动虚拟数字人普世化,为虚拟人生成提供多样化的工具。 应用层主要包括三大应用方向:通过IP影响力和粉丝经济带来商业化、替代真人服务从而实现降本增效、交互能力提升带来的陪伴等定制化服务。 交互层作为终端触达用户,终端硬件将直接影响用户的交互体验。 图2.AI虚拟人产业链 根据应用与核心功能分类,虚拟人可分为身份型和功能型虚拟人。身份型虚拟人以形象特征为认知核心,主要应用于泛娱乐、社交等场景,能够推动虚拟内容生产、成为个人在虚拟世界的分身;服务型虚拟人主要定位为替代人工提供服务,随着交互能力的提升,可实现陪伴、关怀等服务。 图3.虚拟人可分为服务型与身份型 AI赋能虚拟人行业,市场空间广阔。根据艾媒咨询数据,2022年我国虚拟人核心市场规模达到120.8亿元,同比增长94.2%。2023年AI大模型相继发布,有望赋能虚拟人产业,实现多环节降本增效,大幅提升应用端交互能力,到2025年虚拟人行业核心市场规模有望达到480.6亿元。 图4.虚拟人市场规模 2AI全方位赋能虚拟人产业,制作端降本增效,多模态交互能力提升 根据头豹研究院,构建虚拟人的基本技术架构包括虚拟人形象制作、驱动与交互。形象制作主要分为手绘、CG建模、AI的方式;驱动、交互环节分为CG+中之人技术、AI驱动技术。AI驱动数字人主要表现为通过AI建模和训练,基于性格特征和态度观点的AI交互。 图5.构建虚拟人的基本技术架构 根据IDC咨询,根据虚拟人的自动化水平,可分为L1-L5阶段。L1阶段虚拟人依赖人工制作形象和动画,L2阶段虚拟人依赖外部动捕设备采集肢体、表情和口型信息,L3阶段虚拟人依赖算法驱动肢体、姿态等拟人化特征。AI推动虚拟人智能化水平提升,实现虚拟数字人向L4、L5层级迈进,业务价值、自动化水平大幅提升。 图6.AI赋能虚拟人产业 根据商汤智能研究院,AI数字虚拟人三大特征包括:多模态交互、深度学习能力、AIGC生产力。相较早期数字人制作对人工依赖较高,AIGC大幅提升了AI数字人制作效率,制作门槛降低;大模型多模态生成能力提升了虚拟人交互能力,真人替代能力提升;相较于早期数字人,深度学习等算法使得AI数字人具备更高创造力。 图7.AI数字虚拟人三大基本特征 2.1AI推动虚拟数字人产业实现降本增效 虚拟人的构建流程主要包括建模、驱动和渲染等环节。建模作为基础环节,是决定虚拟人整体形象的关键,驱动实现虚拟人由静到动,渲染技术提升画面质感,增强虚拟人的真实感。 驱动环节分为面部和身体动作的驱动。面部以嘴型为主,主要通过算法训练建立文本到语音再到嘴型视频的对应关系,得到文本驱动嘴型变化的模型。虚拟人的身体动作主要通过动作捕捉技术获得真人演员的行为动作,再将其移植到虚拟人上。动捕技术包括光学、惯性和基于计算机视觉三种,光学动捕精度较高,应用也较为成熟,设备造价较高;惯性动作捕捉成本较低,场地的限制较小,但精度较差。计算机视觉动捕较为简便,利用摄像头拍摄的图像进行三维建模,成本也相对较低,而建模的计算量较大。 渲染环节通过对3D虚拟人或虚拟场景加入几何、视点、纹理、照明和阴影等信息,实现从模型到图像的转变,这一环节决定了数字人最终的呈现效果。根据虚拟人应用场景的不同,渲染方式可以分为离线渲染和实时渲染,如制作影视作品不需要追求渲染速度,可以通过离线渲染实现更好的画面质量;实时渲染技术侧重交互和及时性,适用于游戏、虚拟客服、虚拟主播等用户频繁交互的场景,目前最新的Unity和虚幻引擎已支持高画质实时渲染。 表1.虚拟人制作的主要环节及工具环节方式工具 3D虚拟人应用广泛,同时制作成本较高。根据外型可分为2D、3D虚拟人,2D虚拟人建模是生成图像的过程,可以通过深度学习算法高精度实现,技术已较为成熟,目前Midjourney、StableDiffusion等AI生成软件已经能够低成本实现2D图像的生成。根据腾讯研究院,3D虚拟人进一步可分为卡通型、风格化、写实、超写实和高保真数字人。3D虚拟人制作涉及技术领域多、制作方法不统一,自动化程度较低,难以高质高效实现虚拟人制作,因为制作成本较高。我们认为,AI工具端进步推动虚拟人制作降本增效,虚拟引擎旗下MetaHuman提供了高保真虚拟人的建模工具。 图8.虚拟人按外型分类 图9.虚幻引擎旗下MetaHuman高保真虚拟人建模示意 AI能够在虚拟人制作的多环节实现替代,2D数字人的视频生成、3D数字人的建模、视频驱动、物理仿真等多个环节。根据腾讯研究院,AI在虚拟人制作中可以替代人工建模、实现算法模拟动作,提高数据采集速度,在驱动环节实现降本增效。 图10.AI在虚拟人制作环节的替代 传统的AI数字人技术路线是对人进行深度采集、深度建模,制作时间长、效率低且成本高。根据新华智云公开信息显示,基于深度学习模型、动作模拟、情感模拟等智能科技,只需采集2-5分钟的真人视频,AI最快训练1小时,即可生成形象逼真、表情到位、口型匹配的数字分身。相比过去,公司实现了数字人面部精细度更高,发音和口型更精准,肢体动作更自然,同时数据采集时间缩短75%,训练速度大幅提高。同时,虚拟分身制作对采集要求降低,提供一张真人正面照片,上传到新华智云数字人制作平台,即可生成一个具有真人五官特点的3D写实数字人。 新华智云通过将AI赋能虚拟人制作,缩短了制作时间,降低了数字人制作成本,实现了3D写实数字人的价格大幅压缩。 图11.新华智云数字人 2.2AI推动虚拟人多模态交互能力提升 当前数字人对语言理解仍以文本为主,接入大模型仍需进行技术转化。AI驱动数字人是指数字人的语音表达、面部表情和动作形态等通过深度学习模型进行运算,将其结果实时或者离线驱动,并进行渲染。目前虚拟人接入大模型以文本交互为主,本质是通过ASR-NLP-TTS等AI技术进行转化,实现数字人感知、决策、表达等层面的交互,自然语言大模型与虚拟人的融合还需进一步完善。 AI在虚拟人动作合成的应用方向分为嘴型和其他动作,目前计算机视觉(CV)数字人声唇同步技术相对完善,在游戏中已经大量应用,但表情动作还需完善; 其他动作需要人工配置描述性的数据或者标签驱动,尚未智能合成,但AI驱动数字人向拟人化方向明确。 表2.AI在虚拟人交互场景中的应用 AI大模型多模态生成能力对数字人发展推动潜力巨大,驱动数字人“思想”更像人。根据腾讯《数字人产业发展趋势报告(2023)》,未来AI技术的重点方向是在输入端实现多模态感知输入,在输出端提升多模态交互能力,综合提升数字人的表现力。当前AI虚拟人的交互主要表现为文本的交互,未来发展为基于语义的交互,强化对人情绪的感知和表达。 图12.AI驱动数字人未来发展方向 世优科技AI虚拟人“慕兰”,实现虚拟人与对话式语言模型结合的应用场景落地。慕兰已进行数场直播,能够实现对弹幕提出的不同种类问题进行回答,实现较好的交互效果。天娱数科旗下虚拟数字人“朏朏”接入ChatGPT模型,直播交互能力大幅提升。天娱数科子公司元境科技自研MetaSurfing-元享智能云平台,集智能数字人生成、绑定、驱动、应用为一体,为AI数字人的打造提供了技术支撑。在此基础上,公司虚拟人“朏朏”已完成ChatGPT模型接入,外形更加生动逼真,同时具备了智能交互、智能决策以及多终端部署能力。在直播中,朏朏能够介绍产品特征,并能与观众进行流畅的问答互动。 图13.天娱数科旗下虚拟人直播带货 图14.世优科技旗下虚拟人慕兰 3虚拟人应用端持续落地,商业化前景广阔 3.1广告营销领域:虚拟人成为品牌营销重要工具 当前虚拟人在营销领域的应用主要分为两类:一类是品牌方使用定制化的虚拟人作为品牌的形象代言,产品、品牌形象绑定虚拟人;另一类是具备IP形象及粉丝基础的身份型虚拟人KOL,与品牌方开展合作,实现代言推广。魔珐科技2020年推出原创虚拟人“翎”,已应用至天猫、百雀羚、特斯拉等代言活动中; 同年也为欧莱雅集团开发推出全球首位虚拟品牌代言人“M姐”。 图15.魔珐科技为欧莱雅打造虚拟人形象代言 图16.魔珐科技自有虚拟人翎代言天猫和百雀羚 品牌方自有虚拟人为公司的品牌形象代言,与第三方虚拟人企业合作,整合形式落地较为常见,SaaS等标准化的解决方案是未来的发展方向。当前虚拟人在品牌方广告营销中的应用渗透率较低,品牌方打造虚拟人以定制化的需求为主,第三方虚拟人企业通常以整合形式提供解决方案。随着品牌方虚拟人需求进一步增长,虚拟人制作标准化程度提高,类似SaaS形式的标准化平台解决方案有望获得较大空间。 腾讯旗下“腾讯智影”是一款集成了多种AIGC能力的智能创作工具,能够为用户提供从端