数字人市场与机会
- 应用场景:虚拟偶像、虚拟KOL、虚拟演员、虚拟主持人、虚拟主播、虚拟代言人、虚拟客服、虚拟导游、虚拟专家等。
- 未来趋势:随着智能化水平提升和成本下降,数字人将在元宇宙中发挥重要作用,成为超级助手和情感陪护。
数字人存在的问题
- 成本高昂:制作成本高达数十万至百万,周期长达数月,难以满足企业需求。
- 无法互动:多数数字人仅限于静态展示,缺乏互动功能。
- 场景受限:大多数数字人效果粗糙,难以替代真人。
数字人技术发展路线
- 技术路线:以GAN + NeRF为底层技术,实现快速批量生成、驱动与互动。
- 价值对比:传统CG模式与AIGC数字人在成本、复原度等方面存在差异。
数字人创造与编辑
- CG创造:基于传统计算机图形技术,优点是可控性强但成本高、周期长。
- AIGC创造:通过人工智能技术自动生成图像内容,成本低、效率高但可控性较弱。
数字人驱动
- 中职人驱动:依靠面部捕捉和CG图形学渲染。
- 无中职人驱动:通过Talking head和AIGC图像生成技术。
人机对话与多模态技术
- 人机对话:从单模态迈向多模态,利用多模态融合和自监督学习提升模型性能。
- 多模态大模型:“紫东太初”全球首个多模态大模型,具备强大的拟合能力和泛化能力,性能优异。
典型应用
- 数字人应用:如长安汽车车载终端、杭州文旅数字偶像“杭小忆”。
- 多模态手语模型:国际首个多模态手语模型,应用于特殊人群教育。
总结
该研报详细介绍了数字人在市场中的应用、存在的问题及其技术发展路线,并展示了多模态大模型在人机对话和数字人领域的突破性进展。未来,随着技术进步和成本降低,数字人将在更多领域发挥重要作用。