行业发展专题报告 克劳锐出品2023-10 行业寄语 毛海峰 魔珐科技VP AIGC技术浪潮下,3D虚拟人 应用场景日益成熟,正以前所未有的速度变革与重塑商业世界,成为企业实现降本增效、品效合一的重要载体。 他们是真人的“最佳实践”,能够将金牌员工的能力24*7高效率、低成本地规模化复制到企业各个业务环节,以更好的服务体验,赋能与迭代千行百 业。 熊大 银翼未来创始人 在AIGC元年的时间节点,虚拟 人无疑是人工智能生成式内容举足轻重的一环,随着硬件、人工智能大模型、软件和产业的不断成熟,结合多模态的应用,虚拟人拥有无限可能。同时也坚信硅基生命可以更好地造福碳基生命,让人类文明更 加繁荣与富足。 刘洋 鲁班7号数字人副总裁 AI行业正在迎来自己的 “iPhone时刻”,这已经是一个不可辩驳的事实。 数字人在短视频、直播行业的迅速发展已经在悄然无息的改变我们的生活方式,给我们带来深刻的社会变革。 未来,我们相信,随着AIGC的 进一步发展,数字人将成为人们表达自我、追求进步和探索 创新的重要渠道。 王兴武 深思普慧副总经理 数字人是以人工智能、大数据和机 器学习为基础,是近年来科技发展的重要领域之一,为人们的生活和工作带来了巨大的变革。数字人的出现既提高了生产效率,降低了成本,又为人们提供了更加便捷、智能的服务。数字人行业的快速发展不仅为企业创造了巨大的商机,还为社会带来了更多的就业机会。随着技术的不断进步,数字人行业将会迎来更多的创新和突破,为人们创造更美好的未来。让我们共同期待数字人行业的蓬勃发展,为推动 社会进步贡献力量。 龚文祥 AI电商自媒体 AI是未来十年的风口与趋势, 是比移动互联网还要大10倍以上的机会,而数字人是普通创业者抓住AI机会最好的手段之一,随着数字人越来越流行,用数字人短视频引流,数字人直播卖货变现,将成为传统企 业转型AI的新机会。 01 数字人技术及应用 02 CONTENTS 数字人行业生态系统现状 03 数字人行业发展趋势洞察 核心看点 生产趋势 AI+驱动10大能力升级,向智能化、系统化迈进 C端市场接受度 真实人物虚拟化的接受度较高,但直播内容枯燥感较强 数字人审美偏好 用户认为内外兼修的数字人主播更 具吸引力 行业应用 数字人功能匹配精细化场景放大应用效能,实现智能化解决方案 机遇与挑战 数字人助力企业降本提效,同时面临标准化、规范化考验 生态发展特征 数字人生态内合作关系日益紧密, 产业规模化仍面临效率挑战 数字人技术及应用 •数字人的定义与特征、分类方式、生产流程 •数字人的应用场景 •数字人应用接受度 •数字人应用场景要素 克劳锐指数研究院 定义与特征:具备思考、情感表达和智能决策等能力的虚拟实体 什么是数字人? •定义:数字人是一种以人工智能和计算机科学为基础,结合自然语言处理、情感表达和智能交互等技术的虚拟实体。 •定位:超越单纯的机器执行任务,拥有思考、情感表达和智能决策的虚拟实体,具备模拟、交互、学习和表达等能力,通过与人类进行自然语言对话和行为交互,在各种领域和场景中发挥重要的作用。 行为模拟能力 模拟人类的行为和思维过程,包括语言沟通、感知环境、决策和执行任务等。 感知和交互能力 具备理解和处理自然语言的能力,识别和解析用户的语义和意图,以多种方式进行交互,包括语音、图像、文字等。 学习和适应能力 具备学习和适应能力,能够通过不断的模型训练和数据积累来提升性能和智能水平。 情感表达能力 可以通过语音的音调、语气的变化以及文本或图像上的情感变化,表达情感。 应用多样性 应用场景广泛,包括虚拟助手、社交机器人、直播带货、客服、数字员工、娱乐与艺术创作等。 6 克劳锐指数研究院 发展进化:技术升级推动行业突破与创新,数字人向产业化发展 •计算机生成的2D虚拟人物 •计算机图形学,线框模型和基于像素的图像生成 •科幻作品中出现更多虚拟人物 萌芽阶段 20世纪60-70年代 •三维虚拟人物开始出现 •CG技术、3D建模技术进步,动作捕捉技术发展 •开始应用于游戏和 电影制作 探索阶段 20世纪80-90年代 •接近人类外观的逼真虚拟人物 •视觉增强和处理技术发展,3D全息投影技术逐渐成熟 •游戏、电影、虚拟现实和增强现实等领域开始大规模应用 突破阶段 21世纪初-中期 •智能虚拟数字人规模化 •人工智能技术进步(深度学习、自然语言处理和情感识别) •数字人拥有更强的智能和自主性,具备自然对话、情感交流和个性化服务能力 成长阶段 21世纪-中后期 •虚拟人物高度逼真、精细化、多样化、个性化 •强化学习、生成对抗网络和神经渲染等技术发展全面提升 •数字人成为个人助理、陪伴伙伴或虚拟现实世界的一部分,能够进行深入互动与合作 升级阶段 当前和未来 7 分类方式:不同视角下的数字人分类与示例 克劳锐指数研究院 外观风格交互方式 驱动方式 市场定位 功能定位 数字人的外观风格指其在视觉上呈现的特征和形式的不同种类。 数字人的交互方式指的是与用户进行沟通和互动的方式。 数字人的驱动方式指的是数字人背后的技术和算法。 数字人的产品定位指的是数字人所面向的用户群体和应用方向。 数字人的功能定位指的是数字人在不同场景中的具体应用功能。 示例: 二次元型:具有卡通或动漫风格的数字形象 超写实型:以逼真外观呈现的数字人 数字孪生型:以真实存在的人物为模板生成的数字虚拟人物 示例: 文本交互型:通过文本识别与用户进行对话 语音交互型:通过语音识别和合成技术与用户进行对话 体感手势交互型:通过体感动作识别和处理技术进行交互 示例: 中之人驱动型:通过动作捕捉采集系统完成呈现 AI智能驱动型:通过智能训练驱动实现自适应和智能化 规则驱动型:通过预先设定的规则和逻辑实现交互行为 示例: 个人助理型:为个人用户提供日常助理和服务 娱乐陪伴型:用于娱乐和社交交互的数字伙伴 商业服务型:用于企业和机构的客户服务和商业领域的应用 示例: 智能辅助型:用于在线教学辅助、智能互动、数字员工 内容IP型:用于虚拟偶像、虚拟演出、品牌代言 功能服务型:用于直播带货、数字导购、智能客服 备注:以上仅为部分举例8 克劳锐指数研究院 生产流程:制作流程因数字人类型、应用场景和技术工具而有所不同 数字孪生 3D虚拟IP 二次元数字人 数据采集和处理 IP/角色定位外观和概念设计 3D扫描或摄影 角色设计和绘制 线稿和上色 模型重建和优化 3D建模和细节 动画制作 材质和纹理骨骼绑定和动画 渲染和照明 特效和渲染 中之人驱动:动捕驱动训练优化和细节调整导出和集成 AI驱动: 参数初始化和优化AI训练和验证超参数调优 模型评估和测试模型部署和应用 9 克劳锐指数研究院 实现路径:差异化数据路径生成不同类型的数字人主要分为三类 语音合成型 动作捕捉型 交互对话型 示例:通过音素对应的视位,进行插值,生成对应的口型 示例:通过穿戴动作捕捉设备,以动捕技术驱动,算法驱动合成特效,实时合成呈现数字人 示例:通过语音、文本识别技术,以应答文本驱动技术合成效果,呈现交互结果 实时性技术难度 实时性技术难度 实时性技术难度 适用角色播报型数字主播适用角色娱乐型数字主播适用角色服务型数字人 10 克劳锐指数研究院 生产趋势:AI+驱动10大能力升级,向智能化、系统化迈进 语言模型 生产平台化 功能定制化 沟通情感化 内容多元化 场景真实化 建模智能化 智能化生产 图像模型语音模型 外观精细化 交互实时化 AI+数字人多模态大模型 模型构建模块模型训练模块交互模块 知识体系化 •外形风格 •人物性格 •人设特征 •应用场景 •……. •训练数据收集 •设计模型架构 •优化模型参数 •训练模型迭代 •…… •语义理解 •知识图谱 •情感表达 •感官表情 •……. 环境多样化 11 随着数字人的能力不断增强,可以实现的功能和 应用场景日益丰富,应用范围也愈加广泛,受众对数字人的感知正在悄然变化…… 克劳锐指数研究院 了解方式:「短视频平台」是主要渠道,「视频和直播带货」是主要接触途径 用户获取过数字人相关信息的渠道分布用户接触数字人相关内容的途径分布 短视频平台社交媒体平台 53% 93% 看过数字人的视频内容 79% 电商平台视频平台 41% 35% 看过数字人的直播带货 69% 论坛/帖子新闻资讯类平台 13% 29% 看过数字人非带货类直播内容 34% 朋友推荐传统媒体 10% 7% 与数字人客服交流互动过 23% 数据来源:克劳锐线上调研,N=15013 克劳锐指数研究院 体验感受:真实人物虚拟化的接受度较高,但直播内容枯燥感较强 真实人物虚拟化的接受程度 喜欢的带货主播以虚拟形象直播带货的消费意愿 3.93 喜欢的博主或偶像以虚拟形象展示内容的喜爱程度 4.37 喜欢的博主或偶像的虚拟人物形象的关注程度 4.53 弱 强 直播方式、传播信息幽默搞笑 2.47 直播间的内容表现丰富多样 2.67 直播的视觉感很好 3.41 直播时介绍的内容更加准确 3.67 枯燥/乏味 4.63 虚拟人物直播的体验感 虚拟人物直播带货的认可程度 虚拟主播有可能替代真人主播 3.27 数字人直播带货具备吸引力 3.43 数字人有必要应用在直播电商 3.46 数字人直播带货有一定的了解 4.17 看好数字人直播带货的应用前景 4.53 数据来源:克劳锐线上调研,N=150;接受程度从弱到强为1-714 克劳锐指数研究院 受众审美:用户认为「内外兼修」的数字人主播更具吸引力 外观性别 3.57地域特色场景 3.33 用户对虚拟主播各个维度的吸引程度反馈 着装常规服饰场景 3.24 直播间常规场景 3.38 3.14 年龄 3.52国别 民族服饰3.673.90潮流服饰 仿真户外场景3.29 语音表达 语音 派发红包3.81 3.29 价值观正确 文化 3.43 互动及时回复 3.57 具备文化内涵3.81 音色适中3.62 数据来源:克劳锐线上调研,N=150 3.38特色方言 3.52具备才艺 3.62福袋抽奖 15 克劳锐指数研究院 关注偏好:数字人的「颜值+个性」以及「内容质量」是用户在意的重要属性 用户关注数字人账号的属性指标反馈排序 用户倾向观看的数字人直播类型 数字人形象的颜值、个性等 72% 娱乐直播 76% 发布内容的质量 67% 电商直播 55% 数字人的逼真度与粉丝的互动程度内容更新的频率 与知名品牌、明星的合作程度9% 对外宣传力度7% 35% 28% 47% 文旅直播教育直播政务宣传 其他 11% 27% 23% 36% 数据来源:克劳锐线上调研,N=15016 克劳锐指数研究院 消费偏好:数字人的「表达质量」是「影响消费」的主要因素 •56%的消费者愿意付费观看数字人相关的演出、作品 •49%的消费者愿意购买数字人推荐的相关产品或服务 用户在数字人直播间影响消费的主要因素TOP-5 ①产品介绍/表演表达是否清晰56% ②外形/声音是否符合审美37% ③直播节奏是否有条不紊28% ④对虚拟数字人直播好奇心满足19% ⑤直播间的互动氛围是否热情13% 数据来源:克劳锐线上调研,N=15017 克劳锐指数研究院 认知反馈:多数人认为虚拟主播最大优势是负面风险小,相对真人互动性较差 用户认为数字人相对真人直播的优势用户认为数字人相对真人直播的劣势 几乎不会出现负面新闻 68% 虚拟人与观众之间的交互性较差 74% 直播时间自由 52% 虚拟人建模和动作捕捉的精细度不强 48% 可塑性较强 47% 虚拟人直播内容单一 43% 直播内容多元且独特 32% 虚拟人存在伦理问题 40% 数据来源:克劳锐线上调研,N=15018 克劳锐指数研究院 行业应用:数字人功能匹配精细化场景放大应用效能,实现智能化解决方案 商业营销 •通过各种渠道展示和推广产品