区块链 数字人——GPT4下的杀手级应用 21年,我们在《元宇宙(七):虚拟人的“灵魂”是什么?》中讨论了数字人将是一个重要的交互载体,应用场景广泛,而AI驱动的数字人将使其真正拥有“灵魂”。短短两年,AIGC发展超出了我们的想象。伴随着AI生成算法和包括GPT4以内的多模态的进步,数字人的灵魂将被点燃。 AIGC,数字人的点睛之笔。AIGC解决了数字人“只会念稿、不能交互”的尴尬,生成算法提高了内容创作的效率和便捷性,降低了成本和门槛,同时还丰富了内容创作的多样性和个性化,满足了用户的不同需求和喜好。自然 语言处理大模型有助于提升数字人交互体验,真正让数字人有了灵魂。而ChatGPT所展现出来的高灵活度让人们对AI有了新的认知,它比普通的AI机器人更加像自然人,对信息、知识的挖掘和梳理更充分,对语句的处理更加贴近人类的日常交流表达习惯。 2D仿真数字人爆发在即。3D建模数字人精美度高,但过高的成本和制作周期导致其在商业化应用上存在一定难度,通常被用作品牌大使等场景。但对于市场空间更大的直播带货、教育、客服等场景来说,难以普及。尤其在AIGC发展迅速的现在,2D仿真数字人的制作门槛、周期和成本远远低于3D建模数字人。并且,在市场空间较大的直播带货、娱乐主播、客服和游戏NPC场景下,2D数字人已经足够满足当下的需求,爆发在即。 GPT4+数字人,构筑元宇宙中的“阿凡达”。数字人未来的用途将远不限于主播、客服等,随着算力的提升以及GPT4的模型升级,数字人将成为个人分身“Avatar”,输出文字、图像、音视频,甚至细微到情绪表达。在未来构建数字内容的过程中,将有更多的场合可以用GPU+电耗替代人工,真正打造元宇宙数字世界,使数字人集社交、创作、分享于一身,有望成为GPT4之后、承载多模态的杀手级应用。 投资策略:涉及的赛道可以分为应用、IP和基础设施两大类,其中基础设施可以细分为自然语言处理模型、数据集、AIGC生成算法和算力。数字人应用、IP:蓝色光标、汤姆猫、中科金财、昆仑万维;NLP和AIGC算法:微软、谷歌、百度、科大讯飞、拓尔思;算力层包括:天孚通信、太辰光、中兴通讯、锐捷网络、紫光股份、新易盛、中际旭创等 风险提示:伦理风险:AI驱动的人工智能交互过程中,可能出现伦理风险。技术发展不及预期:AIGC的技术发展不及预期。以及底层硬件技术,如:超级计算机、算力等。政策法律监管风险:目前数字人和AIGC都处于发展初期,在知识版权等问题上还有许多尚不明确的地方。随着相关法律的逐步完善,或初现法律监管的问题。 证券研究报告|行业专题研究 2023年03月13日 增持(维持) 行业走势 通信沪深300 16% 0% -16% -32% 2022-032022-072022-112023-03 作者 分析师宋嘉吉 执业证书编号:S0680519010002邮箱:songjiaji@gszq.com 分析师金郁欣 执业证书编号:S0680521070002邮箱:jinyuxin@gszq.com 分析师顾晟 执业证书编号:S0680519100003邮箱:gusheng@gszq.com 相关研究 1、《通信:“AIGC+系列”—AI视讯,”会议黑洞”的拯救者》2023-03-07 2、《通信:AIGC,通信重估的机会》2023-03-06 3、《通信:持续聚焦数字中国》2023-03-05 请仔细阅读本报告末页声明 内容目录 虚拟数字人产业发生了什么边际变化?3 技术进步推动数字人形象和交互能力提升3 商业模式亟待破圈4 2D仿真数字人——恰逢其时,应运而生,渐成“闪耀新星”6 2D数字人应用场景7 2D数字人在直播、短视频行业率先发力7 数字人生成关键技术9 AIGC——数字人的“点睛”之笔11 提高创作效率、丰富内容多样性11 增强数字人交互体验12 投资策略14 风险提示15 图表目录 图表1:百度AI手语主播(2021年)3 图表2:凌迪Style3D的项目“Sarah”(2022年)3 图表3:基于旧有关键词自然语言处理的小冰对话结果4 图表4:ChatGPT可以深度挖掘已有信息并输出易读易用的回答4 图表5:数字人应用实例5 图表6:2D虚拟新闻主播7 图表7:3D建模数字人柳夜熙7 图表8:2020年中国短视频应用情况调查8 图表9:中国直播电商规模预测9 图表10:影眸科技的全脸皮肤微结构生成技术9 图表11:AI网红AYAYI的服装渲染9 图表14:NLP的两种实现方式10 图表15:波形拼接合成技术10 图表16:参数语音合成技术10 图表17:端到端语音合成技术10 图表18:情感分析的二分类步骤11 图表19:2017-2025年中国数字人核心市场和带动市场规模及预测11 图表20:数字人创作平台Delysium12 图表21:阿里云提供数字人直播saas服务13 图表22:ChatGPT是最快突破百万用户的应用13 图表23:投资标的14 虚拟数字人产业发生了什么边际变化? 2021年,我们写了一篇名为《元宇宙(七):虚拟人的“灵魂”是什么?》的文章,讨论到了数字人将是一个重要的交互载体,应用场景广泛,而AI驱动的数字人将使其真正拥有“灵魂”。短短两年过去了,数字人产业发生了许多变化: 技术进步推动了数字人的形象、表现力和交互的提升,例如使用AI生成技术、3D建模技术、动作捕捉技术和NLP模型等,可以惟妙惟肖地表现人物情绪、动作、语言交流等。 不同类型的数字人(如虚拟偶像、服务型数字人、社交型数字人等)的商业模式逐渐清晰,涉及内容创作、直播互动、广告代言、电商销售等多个领域,场景接受度在提升。 2D仿真数字人在商业上迎来爆发,相比3D建模数字人成本低且应用场景更丰富。 技术进步推动数字人形象和交互能力提升 随着算力提升,新概念的数字人正在打破“皮套人”的固定认知。从外观看,通过超精细渲染,数字人高分辨率的皮肤微结构极大限度地提升了数字人在中、近景出镜的真实程度,拟人表现力显著提高,基本突破“恐怖谷效应”的形格势禁。纵向对比来看,以 专业团队创作的服务型数字人为例,2021年的百度AI手语主播和2022年凌迪Style3D的项目“Sarah”相比,拥有超精细皮肤渲染的Sarah在观感和表情细节(甚至包括皱纹)更加接近真人。 图表1:百度AI手语主播(2021年)图表2:凌迪Style3D的项目“Sarah”(2022年) 资料来源:36kr,国盛证券研究所资料来源:数艺网,凌迪Style3D,国盛证券研究所 从交互看,AIGC强力助攻,数字人对话更加自然,IP型数字人有望摆脱人工内容策划、配音和动补。初代虚拟网红LilMiquela以真人为模型,将面部进行动补、动画处理,剪辑后发布在YouTube。但作为虚拟网红,其策划团队刻意将出镜内容表现为贴近当下时 事,没有考虑人造IP对真实尺度的把控,直接导致Lil失去人气。观众并非需要一个100%贴近现实的虚拟网红,而在AIGC加持下,运营者可以很好地平衡虚拟网红在产出内容时在真实与虚拟之间的界限。 我们认为,数字人的最终形态是完全由AI驱动,即用AI替换掉运营策划团队所扮演的角色。ChatGPT所展现出来的高灵活度让人们对AI有了新的认知,它比普通的AI机器 人更加像自然人,相较以往的AI模型,AIGC概念的ChatGPT对信息、知识的挖掘和梳理更充分,对语句的处理更加贴近人类的日常交流表达习惯。 图表3:基于旧有关键词自然语言处理的小冰对话结果 资料来源:红棉小冰,国盛证券研究所 图表4:ChatGPT可以深度挖掘已有信息并输出易读易用的回答 资料来源:新京报,国盛证券研究所 商业模式亟待破圈 数字人应用场景集中于:需要IP站台,重复劳动居多且工作流程固定的客服,以及知识密集型服务岗位。下面是数字人在文娱、消费和专业服务领域中的应用实例。可以看出,早期的数字人更像执行特定指令的动漫人物。 图表5:数字人应用实例 应用场景案例角色形象 文娱 洛天依演唱会虚拟IP线上演出天猫数字人带货主 虚拟IP直播 播国风数字人天妤虚拟IP运营 消费 SK-II、欧莱雅、Keep、阿里巴巴等品牌的形象代言人 虚拟品牌形象代言人 时尚博主AYAYI产品推广人 中国联通智能客服助理 数字人客服 专业服务 河南数字人教师河 数字人教师 开开平安银行“平安小财 数字人理财师 娘” 资料来源:bilibili,正观新闻,新华网,小红书,网易,中国联通,知乎,平安银行,国盛证券研究所 如何破解数字人市场商业模式单一,产品缺乏差异化的问题?“科技感”是数字人最大的标签,也是最容易限制数字人发展的阻碍。与AI产生拟人交互、高度定制化,是吸引 C端用户的主要手段,批量生产IP、减少人类劳动压力,是吸引B端用户的核心办法,大部分数字人和背后的运营团队都逃不开这种单一的商业模式。 数字人本质上是一款强内容驱动的产品,但目前数字人公司更多是从产业布局、业务需求、技术生产等角度出发,普遍缺乏内容人才。从底层技术看,国内大部分数字人公司都是基于UE5等开源技术进行开发,这导致很少有公司具备尖端技术优势。在AIGC大规模商业化应用前,大部分企业只能在内容、运营、创意上展开竞争。数字人的各种人设和行为皆是团队编辑好的剧本,用户在台前看到的数字人都只是背后运营团队的产出。 因此,在商业层面,早先市场关注的3D数字人存在“成本高、周期长、缺交互”的问题,影响了商用推广。更进一步地,我们认为,3D数字人一定程度上反而提高了内容创作的壁垒。 2D仿真数字人——恰逢其时,应运而生,渐成“闪耀新星” 在《元宇宙(七):数字人的“灵魂”是什么?》中,我们提到了3D建模数字人对于技术要求高、制作周期和成本高。如柳夜熙这样精度的数字人,制作成本至少在50万以上,且每期视频的创作周期需要一个月左右,幕后创作团队包括导演、策划、制片、三维、运营等人员。3D建模数字人精美度很高,但过高的成本和制作周期导致其在商业化应用上存在一定难度,通常被用作品牌大使等场景。但对于市场空间更大的直播带货、教育、客服等场景来说,难以普及。由此,当大部分人都惊叹于3D数字人之精美时,我们却聚焦到2D仿真数字人,该技术被广泛应用在了直播带货、MCN当中,可谓应运而生。 通常情况下,2D仿真数字人使用静态扫描技术制作,即通过40-60个照相机对真人进行全方位拍照,根据拍照光线和角度进行矩阵扫描,从而在软件中呈现出2D立体形象。静态扫描技术仅需拍照搭配上少量所需数据,就能以较低的成本制作出2D数字人形象。尤其在AIGC发展迅速的现在,2D仿真数字人的制作门槛、周期和成本远远低于3D建模数字人。并且,在市场空间较大的直播带货、娱乐主播、客服和游戏NPC场景下,2D数字人已经足够满足当下的需求。伴随着AIGC的发展,2D数字人也同样具备语言交互功能,能回答消费者的问题,这些问题因较为垂直而更容易用模型训练,大模型之下,这种交互性能将持续得以提升。 图表6:2D虚拟新闻主播图表7:3D建模数字人柳夜熙 资料来源:公开资料,国盛证券研究所资料来源:公开资料,国盛证券研究所 2D数字人应用场景 2D数字人的优势在于不但可以提供定制化的风格和造型来满足不同客户的偏好,同时也不存在“塌房”的风险。主要可以被运用在以下四个场景: 服务业:在教育、银行、医疗领域提供服务,引入类似于ChatGPT的NLP大模型以后,交互性会变得更好。如医疗导诊,尤其针对一些老年病人可以更好地做到一对一的交互带领。教育领域,可以针对不同学生的进度提供定制化讲解。 影视作品:在电影、电视剧和动画片里作为演员存在,不但可以根据需求和剧情定制形象,同时也能避免出现由于演员私人的一些行为导致整部作品无法按时上映的风险出现。 虚拟UP主:娱乐直播、表演歌曲、舞蹈、游戏等,可以打造个性化的形象和风格,定制化满足粉丝的需求和喜好,且不会出现塌房事件。