20220420-企业级AI数字人白皮书.indd12022/4/22下午4:06 目录 04导语篇:L4级以上的才是数字人未来 06认知篇:AI数字人的特征和价值 多模态交互、深度学习和AIGC是AI数字人的三大特征 从“替代”到“连接”,AI数字人应用的三大方向 10生态篇:AI数字人产业生态“拼图” 底层软硬件技术决定数字人系统“进化”水平 AIGC赋能平台创造“低代码”数字人开发环境运营管理平台打通技术到应用的“最后一公里”多终端覆盖与数字人随时随地建立连接 行业应用推动数字人价值的“增长飞轮” 14能力篇:商汤赋能AI数字人走入千行百业 AI技术“双维度”研发投入,夯实AI数字人生产力底座 AIGC“全栈式”布局,打造“一站式”生产流水线智能化生成引擎:增强人物形象的生动性 智能化驱动引擎:提升人物动作的协调性智能化交互引擎:提高人物理解的智慧性 制作运营“一体化”,面向行业“全链路”赋能全终端、全行业方案覆盖,让数字人走入千行百业 19实践篇:AI数字人应用八大场景 场景一:金融网点“新窗口” 场景二:在线互金“新入口”场景三:商场交互“新触点”场景四:文博讲解“新体验”场景五:品牌营销“新代言”场景六:企业前台“新形象”场景七:智慧车舱“新助手”场景八:虚拟活动“新服务” 27展望篇:AI数字人未来十大展望 展望一:产业数字化转型的重要抓手 展望二:企业竞争的核心“人力”资产 展望三:老龄化催生“陪伴型”数字人需求 展望四:开发平台“在线化”(DHaaS)是趋势展望五:未来虚实融合世界的基本组成 展望六:数据安全和用户隐私保护仍是关键展望七:高等级数字人依赖通用AI技术发展 展望八:“云边端”协同计算支撑规模化应用未来展望九:数字人资产确权和流通将促进交易市场活跃展望十:数字人市场发展将诞生一批新业态、新机遇 导语篇 L4级以上的才是数字人未来 2021年是元宇宙元年,随着元宇宙概念的火爆也一同带动了数字人市场的快速升温。据计算全球平均每天都会诞生一个数字人。数字人正成为一股潮流,涌入人们的日常生活——会“捉妖”的虚拟美妆达人柳夜熙,抖音出道三天点赞即超百万,一夜之间成为国内虚拟偶像界的“顶流”;在江苏卫视跨年演唱会上,昔日歌后邓丽君“重返”舞台,与歌手周深同台对唱,交织几代人的青春记忆;而在刚刚落幕的冬奥会上,二十多位数字人同台亮相,担当起手语主播、气象主播、奥林匹克公益宣传大使、冬奥官方周边带货主播等各式角色,代替真人为冬奥赛事提供服务支持……数字人的热度吸引着众多参与者纷纷入局,据企查查数据显示,国内现有“数字人”相关企业超过28万家,近五年的新增注册企业增速复合增长率达到近60%。 与此同时,资本也在不断涌入数字人赛道。据天眼查数据不完全统计,2021年全年,数字人相关投资共27笔,融资金额从数百万元人民币到数千万元美元不等。2022年开年不到一个月的时间,数字人领域即完成了近百起融资,累计额度超过4亿元人民币。 数字人市场的热度不减,除与元宇宙概念加持的关系外,技术驱动和需求牵引也是助力的关键。 数字人的核心是“人”,本质上是通过数字技术提高数字人的综合体验,使之带来真人般的感受和互动。 一方面,随着人工智能、虚拟现实、高精度渲染等技术的发展和融合,数字人的拟人化程度愈来愈高,从形象、表情、姿态、动作,再到语音、语意、语态等方方面面正在逐步逼近真人水平。例如,超写实数字人(Metahuman)已成为当前主流,柳夜熙、“邓丽君”等都是超写实数字人的代表,拥有高度逼真的数字化外观形象。另一方面,人工智能技术在数字人形象生成、动作驱动和语言交互等环节的深入应用,也将进一步提升数字人制作的自动化水平,推动数字人市场从利基走向大众。 在需求侧,消费领域的流量经济和产业领域的人口红利都在面临增长瓶颈,对生产效率与成本提出了更多要求。数字人的高度拟人化代替真人角色进入生产生活各个领域,将成为数字经济发展的“新动能”,为Z时代新消费市场,以及产业数字化转型构筑巨大的想象空间和应用前景。据头豹研究所测算,2030年我国数字人整体市场规模将达到2700亿元。 4导语篇:L4级以上的才是数字人未来 数字人的拟人化,以及生产制作的自动化程度反映数字人系统整体进化和发展水平,代表着数字技术综合运用能力和成熟度体现。根据“拟人化”和“自动化”两个维度,我们可以将数字人分成L1-L5五个等级,如下图所示。 L4 完全实现智能化交互,可处理全局性、通用性问题 L3 智能化交互,但在特定场合需要人工接管 场景:个性化虚拟助手 L2 主要依赖算法驱动口型、表情、肢体动作 场景:垂直领域逐步代替真人服务等 L1 主要依赖外部动捕设备采集口型、表情、肢体动作信息 场景:实时互动等 以人工制作为主场景:平面展示等 场景:视频录播等 拟人化程度 L5 理解智能 动作协调 形象写实 Al在各个制作环节的渗透程度 自动化水平 数字人L1-L5等级(来源:商汤智能产业研究院) 其中,我们将L4和L5等级的数字人统称为“AI数字人”。Ta们不仅具备高度的拟人化呈现,在形象、动作和智力层面都更接近于真人水平,能够听懂、看懂、有记忆、自学习,与人进行自然交互;同时,在制作流程中也融合了大量的人工智能算法技术来提升数字人的生产效率,降低数字人的制作成本。我们认为,只有达到L4级别及以上的数字人才能真正的走入千行百业,在消费和产业领域大放异彩。 那么,AI数字人具有哪些特征?它的市场价值、产业生态和发展趋势又是如何?商汤科技作为一家人工智能企业,我们在生态中扮演怎样的角色,又是如何赋能AI数字人产业的可持续发展?白皮书将分别从认知、生态、能力、实践和展望五个方面为大家展现数字人发展的未来图景。 企业级AI数字人|数字经济发展“新动能”5 01 认知篇 AI数字人的特征和价值 多模态交互、深度学习和AIGC是AI数字人的三大特征07 从“替代”到“连接”,AI数字人应用的三大方向08 认知篇生态篇能力篇实践篇展望篇 20220420-企业级AI数字人白皮书.indd62022/4/22下午4:06 多模态交互、深度学习和AIGC是AI数字人的三大特征 应用 多模态交互是“核心力” 替代真人角色的关键 AI数字人 三大基本特征 价值 深度学习是“创造力” 越来越“聪明” 制作 AIGC是“生产力” 降低制作门槛 AI数字人的三大基本特征(来源:商汤智能产业研究院) 首先,在应用层面,多模态交互是AI数字人的“核心力”。 我们认为,具备足够自然和拟真的多模态交互能力,是数字人在更广泛的应用场景中逐步替代真人角色的关键。所谓“多模态交互”,即是将深度学习神经网络和计算机图形学相结合,充分模拟人与人之间自然真实的交互方式,实现“听得懂,看得见,说得出”的人机交互效果。 拥有多模态交互能力的AI数字人,不仅能够呈现传统语音对话无法展现的多媒体信息,通过结合计算机视觉技术,还能完成身份识别、手势识别、情感识别等多项交互任务,让交互过程更加丰富且高效。与此同时,可视化的写实形象也赋予了AI数字人独特的情感温度,有助于建立人性化的情感纽带。 其次,在价值层面,深度学习是AI数字人的“创造力”。 每一个AI数字人背后都有一个“智慧的大脑”,可以基于语音语义理解等技术,结合不同领域的知识库和海量数据训练,进行深度学习和迭代升级,让自己变得越来越“聪明”,越来越专业,从而能够快速适应瞬息万变的市场变化和细分化的场景需求,不断打破即有的应用边界,为用户持续创造新价值和新体验。 企业级AI数字人|数字经济发展“新动能”7 20220420-企业级AI数字人白皮书.indd72022/4/22下午4:06 第三,在制作层面,AIGC是AI数字人的“生产力”。 高制作成本和长制作周期掣肘数字人产业规模化发展。传统数字人生产过程中,从人物建模到动画设计和制作等各个环节几乎都依赖人工“雕琢”而成。譬如,以人物建模为例,传统建模环节大概要花费数月时间。此外,要让模型动起来,前面的准备工作(蒙皮、BlendShape等)以及后续的动画制作及优化环节也需要花费数月时间,无论是时间成本还是人工成本都是一个相对较大的投入。 AIGC重塑生产流程,在人物模型的重建、动画准备和制作等各个环节辅助数字人自动化生成,大幅加速数字人生产,降低制作门槛和成本投入,是AI数字人生产力之本。以人物建模环节为例,例如,商汤科技为软银大会打造的软银COO今井康之的AI数字人形象,即是基于少量照片的面部扫描,结合AI算法快速生成数字人高精度3D模型,将传统以月计算的制作周期缩短至数天内完成。 从“替代”到“连接”,AI数字人应用的三大方向 虚拟世界 虚拟主持人 虚拟偶像虚拟主播 虚拟KOL虚拟代言人 虚拟演员虚拟品牌官 ...... 虚拟客服 虚拟导游虚拟专家虚拟讲解员 ... 未来 超级助手/入口 随着智能化水平提升、 成本下降 真实世界 使用目的 IP影响力 粉丝经济 替代真人服务 降本增效 人性化陪伴和智能化服务 底层逻辑 替代 连接 AI数字人应用方向(来源:商汤智能产业研究院) 根据使用目的和底层逻辑不同,AI数字人可大致分成三大应用方向。 方向一:主要以创建IP影响力或打造粉丝经济为目的的AI数字人应用,包括虚拟偶像、虚拟KOL、虚拟演员、虚拟主播等。 8认知篇:AI数字人的特征和价值 基于“IP孵化+内容运营”,赋予Ta们独特的人设和人格特质,以此来吸引不同受众群体的关注,从而形成一定规模的流量基础和情感链接,再通过诸如直播带货、跨界品牌代言、IP授权周边衍生品、娱乐演艺等多种手段来实现价值闭环或进行商业化变现。 相对真人IP,数字人IP的可塑性更强。包括形象、人设及背景故事的创作自由度为数字人IP的商业创新带来了更大的想象空间,重塑粉丝经济。例如,可邀请用户或粉丝一起参与数字人IP的创建和孵化过程,通过“共创”的方式建立起IP与用户间的强情感关联,让IP更具真实感和生命力。尤其在品牌自建数字人IP路径中,契合品牌调性和消费者心理预期的数字人IP,更有利于品牌理念的有效传递和快速破圈,进而获得在转化层面的更多收益。同时,数字人IP也更具可控性。Ta们不会受到人设崩塌、负面新闻、档期或合约问题等不确定性因素影响,商业安全性和稳定性更高。 方向二:主要以替代真人服务、实现降本增效为目的的AI数字人应用,包括虚拟客服、虚拟前台、虚拟导游、虚拟主持人等。 Ta们根据各自领域所长,能够“7×24小时”在岗不间断的提供服务支持,尤其针对标准化、重复性高的真人服务可以实现数字化替代,并结合业务流程自动化,帮助企业进一步提高生产效率、降低人工服务成本,为企业数字化转型提供新路径。 相对真人服务,AI数字人具有较高的灵活度。Ta们可以随时随地上岗工作,不受主观、时间、环境或外界不确定因素影响,企业可控性强,可以保证服务的稳定性和连续性,也能降低企业因不确定性所带来的隐性成本问题。 同时,AI数字人的边际效益递增现象显著。一方面,虽然前期数字人制作需要一定投入,但数字资产复制使用的边际成本很低,单个数字人的可变成本也低于真人;另一方面,正如上文所述,AI数字人具有较强的深度学习能力,结合知识图谱技术和数据训练,可以不断优化服务精度、扩展业务广度,从而提升企业数字人“人力”资产的投入产出效率。 方向三:随着人工智能、虚拟现实等相关技术的逐步成熟,通过深度学习和认知泛化,AI数字人将会全面突破应用边界,升级成为数字世界的“超级助手”。 与前两个应用方向不同,AI数字人的第三大应用方向不再仅遵循真实世界的“替代”逻辑,初衷更在于满足用户与数字世界的连接和交互需求,实现对于数字世界的直接操作。正如《元宇宙”破壁人“:做虚实融合世界的赋能者》白皮书中所描绘的图景一样,“这些数字人将成为我们在数字世界的AI代理人”。通过与Ta们的直接交互,可以“