您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中国传媒大学]:2024中国虚拟数字人影响力指数报告 - 发现报告
当前位置:首页/行业研究/报告详情/

2024中国虚拟数字人影响力指数报告

2024中国虚拟数字人影响力指数报告

中国虚拟数字人影响力指数报告CHINA METAHUMAN INFLUENCE INDEX2024+3随着人工智能技术的飞速发展,AIGC(Artificial Intelligence Generated Content)已成为促动数字创新的关键驱动力。AIGC 技术不仅具备多模态内容自动生成的能力,涵盖了从文本、图像、音频乃至视频等多种媒介形式的创造性生产,并且正逐步与数字人概念深度融合,昭示着一个全新的虚拟数字互动时代——媒体融合面向纵深发展时代的到来。在虚拟现实空间内,数字人将作为用户代理身份介入社交、娱乐、教育及商务等诸多领域的活动中,超越静态表征阶段,进化为具备智能交互特性和高度个性化的动态实体。这种融合性变革不仅重塑了人类与数字环境的交互模式,更在内容创造和用户体验方面开辟了前所未有的可能性。在这一演变进程中,区块链技术一定程度保证数字人在元宇宙环境中产生安全的交易和互动行为。生成式内容创作技术的兴起,为数字人的原创成果及其产权的确立、流转构建了新的路径与机制。同时,虚拟现实(VR)与增强现实(AR)技术的持续进步,逐渐消融了现实世界与虚拟世界的边界。数字孪生技术在准确复现物理世界的基础上,结合 AIGC 技术能进一步创设出新颖的互动内容与情境,赋予数字人更为逼真的沉浸式体验。尽管 AIGC 与数字人融合的构想勾勒出一幅极具前景的未来画卷,但在实现这一愿景的过程中仍面临一系列挑战。技术的成熟度与应用的普及度构成了首要问题;VR/AR 设备的普及率和用户体验,也成为推广元宇宙和数字人概念的关键因素;由于数字人的活动涉及到海量个人信息的处理,隐私与安全问题也构成了另一挑战维度;法律与伦理困境同样难以回避,数字人和元宇宙的发展或将引发包括版权、身份盗用、虚拟犯罪在内的一系列的法律和伦理问题;经济架构的设计与可持续性问题也值得深入探讨,如何在鼓励创新与激励机制的同时,构建起公正且持久的经济生态系统成为未来的重要课题。本《报告》今年发布第三期,以严谨的学术态度与全方位的数据洞察,为数字人行业的健康发展提供数据参考、关键的理论基础与实践指南。欢迎加入我们的探索之旅,我们将深入探讨 AIGC 与数字人融合的未来趋势,探究 AIGC 技术创新的应用,以及针对数字人在技术、法律、伦理及经济层面上所面临的挑战提出应对策略。我们坚信,通过跨学科的合作和产学研持续的创新,我们将携手迈进一个更为丰富多元、充满活力的数智未来。教授,中国传媒大学媒体融合与传播国家重点实验室首席科学家,课题组总顾问卷首语Editorial 中国虚拟数字人影响力指数报告CHINA METAHUMAN INFLUENCE INDEX2024+4目 录 Contents13524(一)研究对象 06(二)研究新命题 07(二)年度行业观察 12(一)数字人、数智人与 AI Agent 53(二)AIGC 与数字人的创作新范式 55(三)数字人智作手册 57(四)年度智能化案例 60(一)前沿研究 77(二)行业观点 79(三)主理人说 86(四)行业展望 90(一)指数编制说明 24(二)总体指数 29(三)分类榜单 32(四)指数发展洞察 45(五)2023 年度虚拟数字人影响力调研展示 48(一)文旅场景应用 65(二)数字营销场景应用 68(三)电商直播场景应用 70(四)智慧媒体场景应用 72背景篇智能篇前沿观点与行业展望影响力报告应用篇 1背景篇BACKGROUND SECTION 6中国虚拟数字人影响力指数报告CHINA METAHUMAN INFLUENCE INDEX2024+背景篇往期《报告》中,我们对研究对象“虚拟数字人”的概念和外延进行了详细的分析及定义。从技术层面看,虚拟数字人可以理解为,是通过计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等技术手段创设,并具有“人”的外观、行为、甚至思想(价值观)的可交互的虚拟形象。从未来媒体形态和服务模式看,计算机图形学、语音合成技术、深度学习、类脑科学、生物科技、计算科学等聚合科技(Converging Technologies)带来语义传播与无障碍传播的新空间,由此诞生的虚拟数字人将以新媒介角色,广泛应用在元宇宙新生态中,担任着信息制造、传递的责任,是元宇宙中“人”与“人”、“人”与事物或事物与事物之间产生联系或发生孪生关系的新介质。经过新一年度的快速发展,“虚拟数字人”已然从小众走向大众,从商业渗透进民用,成为政府政策、学术研究、产业深耕的重要领域,在日常表达、甚至是政策制定中,开始简称为“数字人”。《报告》的评估对象锁定为当前国内商业化应用最好、最具人气的三类数字人:虚拟偶像、虚拟主播、数字员工。(一)研究对象定义:以歌手、演员、模特、网红、游戏高手等“艺人”身份出现,拥有鲜明的个性、才艺设定,活跃于各大社交平台、视频平台、综艺节目等,通过积累流量、人气而获得更多的“工作”的虚拟数字人。运营方式:与真人艺人相似,通过歌曲、硬照、短剧、综艺等作品进行运营。主要代表 :洛天依、星瞳、苏小妹等。定义:虚拟世界的“主持人”,在专业赛道上包括各大媒体推出的数字主持人、数字记者、数字小编等;而在视频平台上活跃的虚拟UP主们则由企业或个人运营,数量庞大。运营方式:专业赛道以新闻报道、综艺节目为主,替代真人主播、记者和编辑;视频平台则以直播互动、直播带货为主。主要代表:央视总台AI王冠、央视网小C、YOYO鹿鸣、狐璃璃等。定义:由政府、企事业单位推出,作为机构的“虚拟员工”,对外展示企业的产品、服务、文化,对内替代行政、培训等部分内部运营功能。智能客服、企业品牌官、虚拟导游、虚拟老师、虚拟学生等是当前数字员工的主要呈现形式。运营方式:对内以替代企业经营各环节的部分功能为主;对外主要以智能服务、品牌代言等为主。主要代表:爱加、班长小艾、度晓晓等。虚拟偶像虚拟主播数字员工 7中国虚拟数字人影响力指数报告CHINA METAHUMAN INFLUENCE INDEX2024+背景篇本章节虚拟数字人模因内容引自课题组成员论文,如有使用请引用原文:张丽锦,吕欣,虚拟数字人:模因论的新“锚点”——模因论视域下的虚拟数字人:概念、特征和应用[J].学术探索,2024年第3期。2023 年是虚拟数字人行业的政策年也是规范年。国家部委、省、市各级政府持续推出促进元宇宙、虚拟数字人发展的政策数十个(详见行业观察“政策端”数据);与此同时,知名数字人公司魔珐科技与杭州某网络公司的“首例涉虚拟数字人侵权案”二审胜诉,并入选“2023 年度人民法院十大案件”,虚拟数字人及其作品的版权等问题开始受到专业关注。2023 年是虚拟数字人行业的 AIGC 的变现年也是冲击年。在 AIGC 的带动下,数字人的生产、运营都在降本增效,商业应用开始普及,从广电到文旅,从金融到教育,从电商到餐饮,数字人相关的制作、技术、运营招标屡见不鲜;但与此同时,大量同质化、低质量的数字人开始通过短视频入侵社交和电商领域,引发客户投诉。2023年5月9日,抖音发布《抖音关于人工智能生成内容的平台规范暨行业倡议(以下简称数字人行业倡议)》,国内流量最大的平台开始监管虚拟数字人这一新物种。时间转至 2024 年,以 SORA 为代表的文生视频模型的长足进步,文生数字人开始出现,让更多的新研究命题开始浮现:数字人的版权问题、标识标准、跨平台通用规范、伦理道德问题、监管问题等。基于观察研究,课题组尝试使用模因论解题,通过拆解数字人的“多模态”特征,为数字人的标识、使用、监管等提供研究参考。(二)研究新命题新命题:模因论视域下的虚拟数字人模 因(Meme),又译为觅母、弥母、米姆、谜因、拟子等,由英国进化生物学家理查德·道金斯对比基因(Gene)提 出:基因存在于生物细胞的细胞核里面,而模因是以语言、信仰、故事、艺术设计、音乐、科学定理等形式存在于我们的大脑之中;模因是传递和繁衍社会文化与文明的基本单元,是文化复制因子,模因的传播是语言、信仰、观点、行为等的传播。在AI技术的推动下,数字化生产、生活快速普及,虚拟偶像、数字员工、虚拟主播等“虚拟数字人”大量出现,并成为继语言、音乐、图片等之后模因的多模态融合新载体,其将模因理论中关于人本身、人创造的文化及社会关系融为一体,且具备了更快速、甚至可独立进化的新趋势。这为虚拟数字人的研究、应用观察都提供了新的理论和视角。模因论视域下,虚拟数字人在数字世界中呈现的外形、声音、行为特征和数据,以及承载的文化模因,可统称为其的“数字模因”,结合“人”的个体表达特征,虚拟数字人包含了文本、图像、视频、音频的多模态信息,其数字模因包含了形、声、行、神(即文化模因)四个要素。我们认为以交互、服务为目的,具备形、声、行、神四类模因中的一类或多类数字模因的对象,都属于虚拟数字人。 8中国虚拟数字人影响力指数报告CHINA METAHUMAN INFLUENCE INDEX2024+背景篇形模因1虚拟数字人的外观和形象层次,涵盖了其外观、造型、配饰等形象设计,是虚拟数字人在视觉上产生影响的基本元素,对用户第一印象的形成起着关键作用。从“复制因子”属性来看,形模因的复制有两条明显的“道路”:一是以“真人复刻”为目标,不断拓展设计精度,去接近和还原真人;二是以“拟人”为目标,通过物理世界的动物、植物等赋予人的“形模因”进行再创造,如具有人类特征的眼、口、鼻、耳、手、脚、服装等。结合当前实践,虚拟数字人的形模因可以进行更细致的分类,如根据图形维度,分为2D和3D两大类,2D为平面驱动式,3D需要建模完成;从外形上可分为二次元、高仿真、超写实等风格;按照设计由易到难,市场上有2D真人型、二次元型、3D卡通型、3D真人型、3D超写实等类型。形模因是所有虚拟数字人“诞生”的首个要素,是承载了设计学、美学的重要模因,是最直观地形成用户印象的模因。形模因的演化与社会审美紧密相关,无论是哪种模因类型,都有其不同的追随者,因此形模因的多样性将长期存在,且其美术评级标准例将长期多元化。例如二次元风格的洛天依与超写实的星瞳虽然风格不一,但在审美评级上都成为成功范本。虚拟数字人四大模因的分类及特征声模因2虚拟数字人的语言和对话层次,包含了其音色、语调、语速、用词、语种等声音设计和语言表达,是虚拟数字人与用户交流的主要方式,会直接影响用户对其的感知和情感体验。虚拟数字人声模因的表现主要通过声音克隆、语音合成。从“复制因子”的属性上看,声模因分为通用TTS和个 9中国虚拟数字人影响力指数报告CHINA METAHUMAN INFLUENCE INDEX2024+背景篇性化TTS两大类,其复制方式目前主要有“拼接法”和“参数法”两种:拼接法,从预先录制的大量语音中,选择所需的音节、音素等基本单位拼接而成,这种声模因质量高,但所需语料数据大,成本也高;参数法,根据统计模型来产生每时每刻的语音参数(包括基频、共振峰频率等),然后把这些参数转化为波形。作为重要的交互模因,声模因直接关系虚拟数字人的使用体验。当前,通用TTS主要用拼接法,个性化TTS则多使用参数法,智能客服、有声读物等都是声模因可以独立应用的、常见的应用场景。在抖音、快手、B站、小红书等虚拟数字人聚集平台,声模因往往是“通用模型”,如萝莉音、大叔音、游戏音,甚至是“广西老表语音包”等都成为流行的声模因。而在虚拟数字人的实际应用中,个性化TTS的制作、真人语音的“高保真、超写实”的克隆需求开始增加。如:3D真人虚拟主播,需要将真人的语音、语调、语速、语气、停顿、重音、尾音等都进行高保真,然后输出;而拥有“人设”的虚拟偶像、数字员工等,其设计者们也是不断追求其声音的“真”度、独特性。行模因3虚拟数字人的动作和行为层次,包括其表情、动作、互动方式等。虚拟数字人的动作、行为及互动方式设计对于创造生动、有吸引力的用户体验至关重要,是与用户建立联系的重要手段。虚拟数字人的行模因通过表情、微

你可能感兴趣

hot

中国虚拟数字人影响力指数报告(2021年度)

文化传媒
中国传媒大学2022-02-10
hot

虚拟数字人综合评估指数报告

信息技术
清华大学2022-09-16
hot

2022虚拟数字人综合评估指数报告

信息技术
清华大学2022-09-05
hot

2022虚拟数字人综合评估指数报告

信息技术
清华大学2022-01-16