行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

2024中国虚拟数字人影响力指数报告

信息技术 2024-04-08 中国传媒大学好运联联-小童

本报告研究了中国虚拟数字人行业的影响力，包括数字人、数智人与AI Agent的概念，AIGC与数字人的创作新范式，数字人智作手册，年度智能化案例，前沿研究，行业观点，主理人说，行业展望，指数编制说明，总体指数，分类榜单，指数发展洞察，2023年度虚拟数字人影响力调研展示等。报告指出，虚拟现实空间内，数字人将作为用户代理身份介入社交、娱乐、教育及商务等诸多领域的活动中，超越静态表征阶段，进化为具备智能交互特性和高度个性化的动态实体。此外，报告还讨论了技术成熟度、用户体验、隐私与安全问题、法律与伦理困境、经济架构设计与可持续性问题等挑战。

卷首语随着人工智能技术的飞速发展，AIGC（Artificial Intelligence Generated Content）已成为促动数字创新的关键驱动力。AIGC 技术不仅具备多模态内容自动生成的能力，涵盖了从文本、图像、音频乃至视频等多种媒介形式的创造性生产，并且正逐步与数字人概念深度融合，昭示着一个全新的虚拟数字互动时代——媒体融合面向纵深发展时代的到来。在虚拟现实空间内，数字人将作为用户代理身份介入社交、娱乐、教育及商务等诸多领域的活动中，超越静态表征阶段，进化为具备智能交互特性和高度个性化的动态实体。这种融合性变革不仅重塑了人类与数字环境的交互模式，更在内容创造和用户体验方面开辟了前所未有的可能性。在这一演变进程中，区块链技术一定程度保证数字人在元宇宙环境中产生安全的交易和互动行为。生成式内容创作技术的兴起，为数字人的原创成果及其产权的确立、流转构建了新的路径与机制。同时，虚拟现实（VR）与增强现实（AR）技术的持续进步，逐渐消融了现实世界与虚拟世界的边界。数字孪生技术在准确复现物理世界的基础上，结合 AIGC 技术能进一步创设出新颖的互动内容与情境，赋予数字人更为逼真的沉浸式体验。尽管 AIGC 与数字人融合的构想勾勒出一幅极具前景的未来画卷，但在实现这一愿景的过程中仍面临一系列挑战。技术的成熟度与应用的普及度构成了首要问题；VR/AR 设备的普及率和用户体验，也成为推广元宇宙和数字人概念的关键因素；由于数字人的活动涉及到海量个人信息的处理，隐私与安全问题也构成了另一挑战维度；法律与伦理困境同样难以回避，数字人和元宇宙的发展或将引发包括版权、身份盗用、虚拟犯罪在内的一系列的法律和伦理问题；经济架构的设计与可持续性问题也值得深入探讨，如何在鼓励创新与激励机制的同时，构建起公正且持久的经济生态系统成为未来的重要课题。本《报告》今年发布第三期，以严谨的学术态度与全方位的数据洞察，为数字人行业的健康发展提供数据参考、关键的理论基础与实践指南。欢迎加入我们的探索之旅，我们将深入探讨 AIGC 与数字人融合的未来趋势，探究 AIGC 技术创新的应用，以及针对数字人在技术、法律、伦理及经济层面上所面临的挑战提出应对策略。我们坚信，通过跨学科的合作和产学研持续的创新，我们将携手迈进一个更为丰富多元、充满活力的数智未来。目录Contents 2影响力报告背景篇（一）指数编制说明24（二）总体指数29（三）分类榜单32（四）指数发展洞察45（五）2023 年度虚拟数字人影响力调研展示48 （一）研究对象06（二）研究新命题07（二）年度行业观察12 3 智能篇应用篇（一）数字人、数智人与 AI Agent53（二）AIGC 与数字人的创作新范式55（三）数字人智作手册57（四）年度智能化案例60 （一）文旅场景应用65（二）数字营销场景应用68（三）电商直播场景应用70（四）智慧媒体场景应用72 5 前沿观点与行业展望（一）前沿研究77（二）行业观点79（三）主理人说86（四）行业展望90 1背景篇BACKGROUND SECTION 背景篇（一）研究对象往期《报告》中，我们对研究对象“ 虚拟数字人” 的概念和外延进行了详细的分析及定义。从技术层面看，虚拟数字人可以理解为，是通过计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等技术手段创设，并具有“ 人” 的外观、行为、甚至思想（价值观）的可交互的虚拟形象。从未来媒体形态和服务模式看，计算机图形学、语音合成技术、深度学习、类脑科学、生物科技、计算科学等聚合科技（ConvergingTechnologies）带来语义传播与无障碍传播的新空间，由此诞生的虚拟数字人将以新媒介角色，广泛应用在元宇宙新生态中，担任着信息制造、传递的责任，是元宇宙中“人”与“人”、“人”与事物或事物与事物之间产生联系或发生孪生关系的新介质。经过新一年度的快速发展，“虚拟数字人”已然从小众走向大众，从商业渗透进民用，成为政府政策、学术研究、产业深耕的重要领域，在日常表达、甚至是政策制定中，开始简称为“数字人”。《报告》的评估对象锁定为当前国内商业化应用最好、最具人气的三类数字人：虚拟偶像、虚拟主播、数字员工。虚拟偶像定义：以歌手、演员、模特、网红、游戏高手等“艺人”身份出现，拥有鲜明的个性、才艺设定，活跃于各大社交平台、视频平台、综艺节目等，通过积累流量、人气而获得更多的“工作”的虚拟数字人。运营方式：与真人艺人相似，通过歌曲、硬照、短剧、综艺等作品进行运营。主要代表 :洛天依、星瞳、苏小妹等。虚拟主播定义：虚拟世界的“主持人”，在专业赛道上包括各大媒体推出的数字主持人、数字记者、数字小编等；而在视频平台上活跃的虚拟UP主们则由企业或个人运营，数量庞大。运营方式：专业赛道以新闻报道、综艺节目为主，替代真人主播、记者和编辑；视频平台则以直播互动、直播带货为主。主要代表：央视总台AI王冠、央视网小C、YOYO鹿鸣、狐璃璃等。数字员工定义：由政府、企事业单位推出，作为机构的“虚拟员工”，对外展示企业的产品、服务、文化，对内替代行政、培训等部分内部运营功能。智能客服、企业品牌官、虚拟导游、虚拟老师、虚拟学生等是当前数字员工的主要呈现形式。运营方式：对内以替代企业经营各环节的部分功能为主；对外主要以智能服务、品牌代言等为主。主要代表：爱加、班长小艾、度晓晓等。（二）研究新命题 2023 年是虚拟数字人行业的政策年也是规范年。国家部委、省、市各级政府持续推出促进元宇宙、虚拟数字人发展的政策数十个（详见行业观察“政策端”数据）；与此同时，知名数字人公司魔珐科技与杭州某网络公司的“首例涉虚拟数字人侵权案”二审胜诉，并入选“2023 年度人民法院十大案件”，虚拟数字人及其作品的版权等问题开始受到专业关注。 2023 年是虚拟数字人行业的 AIGC 的变现年也是冲击年。在 AIGC 的带动下，数字人的生产、运营都在降本增效，商业应用开始普及，从广电到文旅，从金融到教育，从电商到餐饮，数字人相关的制作、技术、运营招标屡见不鲜；但与此同时，大量同质化、低质量的数字人开始通过短视频入侵社交和电商领域，引发客户投诉。2023 年 5 月 9 日，抖音发布《抖音关于人工智能生成内容的平台规范暨行业倡议（以下简称数字人行业倡议）》，国内流量最大的平台开始监管虚拟数字人这一新物种。时间转至 2024 年，以 SORA 为代表的文生视频模型的长足进步，文生数字人开始出现，让更多的新研究命题开始浮现：数字人的版权问题、标识标准、跨平台通用规范、伦理道德问题、监管问题等。基于观察研究，课题组尝试使用模因论解题，通过拆解数字人的“多模态”特征，为数字人的标识、使用、监管等提供研究参考。新命题：模因论视域下的虚拟数字人模因（Meme），又译为觅母、弥母、米姆、谜因、拟子等，由英国进化生物学家理查德·道金斯对比基因（Gene）提出:基因存在于生物细胞的细胞核里面，而模因是以语言、信仰、故事、艺术设计、音乐、科学定理等形式存在于我们的大脑之中；模因是传递和繁衍社会文化与文明的基本单元，是文化复制因子，模因的传播是语言、信仰、观点、行为等的传播。在AI技术的推动下，数字化生产、生活快速普及，虚拟偶像、数字员工、虚拟主播等“虚拟数字人”大量出现，并成为继语言、音乐、图片等之后模因的多模态融合新载体，其将模因理论中关于人本身、人创造的文化及社会关系融为一体，且具备了更快速、甚至可独立进化的新趋势。这为虚拟数字人的研究、应用观察都提供了新的理论和视角。模因论视域下，虚拟数字人在数字世界中呈现的外形、声音、行为特征和数据，以及承载的文化模因，可统称为其的“ 数字模因 ”,结合“ 人 ” 的个体表达特征，虚拟数字人包含了文本、图像、视频、音频的多模态信息，其数字模因包含了形、声、行、神（即文化模因）四个要素。我们认为以交互、服务为目的，具备形、声、行、神四类模因中的一类或多类数字模因的对象，都属于虚拟数字人。背景篇虚拟数字人四大模因的分类及特征形模因1 虚拟数字人的外观和形象层次，涵盖了其外观、造型、配饰等形象设计，是虚拟数字人在视觉上产生影响的基本元素，对用户第一印象的形成起着关键作用。从“复制因子”属性来看，形模因的复制有两条明显的“道路”：一是以“真人复刻”为目标，不断拓展设计精度，去接近和还原真人；二是以“拟人”为目标，通过物理世界的动物、植物等赋予人的“形模因”进行再创造，如具有人类特征的眼、口、鼻、耳、手、脚、服装等。结合当前实践，虚拟数字人的形模因可以进行更细致的分类，如根据图形维度，分为2D和3D两大类，2D为平面驱动式，3D需要建模完成；从外形上可分为二次元、高仿真、超写实等风格；按照设计由易到难，市场上有2D真人型、二次元型、3D卡通型、3D真人型、3D超写实等类型。形模因是所有虚拟数字人“诞生”的首个要素，是承载了设计学、美学的重要模因，是最直观地形成用户印象的模因。形模因的演化与社会审美紧密相关，无论是哪种模因类型，都有其不同的追随者，因此形模因的多样性将长期存在，且其美术评级标准例将长期多元化。例如二次元风格的洛天依与超写实的星瞳虽然风格不一，但在审美评级上都成为成功范本。2 声模因虚拟数字人的语言和对话层次，包含了其音色、语调、语速、用词、语种等声音设计和语言表达，是虚拟数字人与用户交流的主要方式，会直接影响用户对其的感知和情感体验。虚拟数字人声模因的表现主要通过声音克隆、语音合成。从“复制因子”的属性上看，声模因分为通用TTS和个背景篇性化TTS两大类，其复制方式目前主要有“拼接法”和“参数法”两种：拼接法，从预先录制的大量语音中，选择所需的音节、音素等基本单位拼接而成，这种声模因质量高，但所需语料数据大，成本也高；参数法，根据统计模型来产生每时每刻的语音参数（包括基频、共振峰频率等），然后把这些参数转化为波形。作为重要的交互模因，声模因直接关系虚拟数字人的使用体验。当前，通用TTS主要用拼接法，个性化TTS则多使用参数法，智能客服、有声读物等都是声模因可以独立应用的、常见的应用场景。在抖音、快手、B站、小红书等虚拟数字人聚集平台，声模因往往是“通用模型”，如萝莉音、大叔音、游戏音，甚至是“广西老表语音包”等都成为流行的声模因。而在虚拟数字人的实际应用中，个性化TTS的制作、真人语音的“高保真、超写实”的克隆需求开始增加。如：3D真人虚拟主播，需要将真人的语音、语调、语速、语气、停顿、重音、尾音等都进行高保真，然后输出；而拥有“人设”的虚拟偶像、数字员工等，其设计者们也是不断追求其声音的“真”度、独特性。行模因3 虚拟数字人的动作和行为层次，包括其表情、动作、互动方式等。虚拟数字人的动作、行为及互动方式设计对于创造生动、有吸引力的用户体验至关重要，是与用户建立联系的重要手段。虚拟数字人的行模因通过表情、微表情、肢体动作、标志性行为等进行表达，同时也包含了技能定义，如舞蹈技能、音乐技能、金融知识技能、模特表现技能等。例如，初音未来爱给粉丝进行“眨眼”的互动，美妆捉妖达人柳夜熙的招牌动作是盲打键盘，敦煌天妤的飞天、弹琵琶是其标志性动作。当前，与形模因、声模因相比，流畅的、高拟真度的、更加自然、令人愉悦的行模因表达仍然困难，发展受到多重因素的影响，其中包括技术和模因设计两大因素。首先是技术因素，技术水平直接影响了行模因的

点击免费查看完整报告

2024中国虚拟数字人影响力指数报告

你可能感兴趣

中国虚拟数字人影响力指数报告（2021年度）

虚拟数字人综合评估指数报告

2022虚拟数字人综合评估指数报告

2022虚拟数字人综合评估指数报告

2023年中国虚拟数字人行业技术趋势及科技竞争格局调研报告

中国AI驱动虚拟数字人行业报告

2023年中国AI驱动虚拟数字人行业词条报告

2022中国虚拟数字人商业应用前景展望研究报告

中国虚拟数字人行业调研简报-市场简报-智能时代下-头部虚拟数字人厂商打造了哪些明星产品？

2022年中国虚拟数字人研究白皮书（摘要版）