评测背景
2022年以来,数字人技术应用在元宇宙概念刺激下蓬勃发展,但在实际工程落地中面临安全、技术和应用等多方面问题。为推动产业共识,提升工程化落地能力,中国信通院依托CCSA TC602及内容科技产业推进方阵,制定了《数字人系统基础能力要求及评估方法》规范文件,并启动了首批数字人系统基础能力评测。
评测内容
评测从基础技术能力、基础工程化能力、基础安全保障能力三大维度评估数字人系统,涵盖48项测试用例(27必选+21项可选)。其中:
- 基础技术能力:考察形象版权保障、内容追溯能力、内容风险控制等。
- 基础安全保障能力:包括形象技术能力、语音技术能力、驱动技术能力、交互技术能力、内容供给能力、人设定制能力等。
- 基础工程化能力:考察标准资源配置、可移植性、易用性、可扩展性、兼容性、时效性、可靠性等。
评测概况
2022年4月,中国信通院对腾讯、百度、科大讯飞等10家企业进行评测,采取人员访谈、系统操作演示和材料审查相结合的方法。最终9家企业通过评测,通过率为90%。
评测结果分析
- 总体通过率:所有参测产品测试项目平均通过率为96.61%,可选项平均通过率为92.26%。终端渲染SDK支持情况、肖像权及著作权、数字水印支持情况、内容风险控制机制等可选指标项通过率相对较低。
- 数字人形象生成方式:100%的企业支持CG生成3D数字人,75%支持精细化视频录制生成2D数字人,37.5%支持基于单张照片生成2D真人形象数字人,12.5%支持基于单张照片生成3D卡通数字人。
- 交互方式:语音交互、点触交互、视觉交互、多模态交互的支持率分别为100%、62.5%、62.5%、25%。视觉交互主要集中于人脸检测识别,多模态交互则通过对输入的多维信息设置响应策略实现。
- 能力通过率:基础技术能力和基础工程化能力通过率分别为98.214%、97.826%,基础安全保障能力通过率为81.25%,相对较低。
- 各测试项完成度:各家对于各测试项的支持程度各异,整体均有较大提升空间。触发策略和视频驱动是目前实现情感化表达的主要方式,与智能合成的情感化表达尚有距离。大部分企业具备数字水印能力,但还未集成进系统。
研究结论
- 数字人商业价值不断被挖掘和释放,应用领域不断扩围,涉及金融、商业、传媒等多个领域。应用场景不断拓展,涉及客服、助手、主播等场景。接入渠道不断丰富,涉及Web/H5、APP、大屏等多种渠道。
- 基础安全保障能力亟待加强,相关能力仍需完善。
- 各家对于各测试项完成度各异,整体均有较大提升空间。
下一步重点工作
- 继续完善和研制数字人、沉浸式视觉内容等相关标准规范,向上推行业标准和国际标准。
- 打造全国领先的数字内容生成检验检测能力,支撑相关前沿技术验证和评估测试,并完成第二轮数字人系统基础能力和性能分级评测。
- 持续探索数字内容生成相关政策、技术、应用及产业研究,编撰并发布相关产业报告。