AI智能总结
毕娅娜 单位:中国移动研究院邮箱:biyana@chinamobile.com 中国特色元宇宙的实践预示着元宇宙正在从概念走向落地 我国积极探索工业、文娱、生态等领域的全沉浸式、虚实互促的数字化形态。目前国内元宇宙实践以2B/2G的数字孪生复刻与增强为主,2C场景围绕数字人商业模式初步显现,整体产生了实效 元宇宙信息技术最综合的应用,越来越被产业界认为是未来人类生产、生活的重要愿景 元宇宙是“数字中国”“文化自信”“生态文明”的重要载体 二十大报告中,提到“要建设现代化产业体系,坚持把发展经济的着力点放在实体经济上,推进新型工业化,加快建设制造强国、质量强国、航天强国、交通强国、网络强国、数字中国。”“推进文化自信自强。。。增强中华文明传播力影响力,坚守中华文化立场,讲好中国故事、传播好中国声音,展现可信、可爱、可敬的中国形象,推动中华文化更好走向世界。” 元宇宙是建设“数字中国”,传播“文化自信”,构建“生态文明”,讲好中国故事的重要载体www.islide.cc3 元宇宙发展的关键四要素 元宇宙具有学科跨度大、融合创新门槛高、产业支撑体系庞大、治理体系变革深等特点,全社会对元宇宙新技术、新产品、新业态的广泛探索,亟需在政策的指导下形成聚力效应。因此元宇宙发展不单是公司级行为,更要与国家政策、产业发展紧密联动,识别研发布局的关键点,参与国家整体标准体系的搭建,并以生态互补方式递进式发展 •国家政策:是决定顶层设计和产业各方角色的基础,目标是基于新型举国体制构建可信、安全、开放、可治的中国特色元宇宙 •攻关重点:结合国家政策与顶设“以终为始”布局卡位的关键点,目标是牵引建立元宇宙软硬新型信息服务基础设施 •生态构建:通过元宇宙子链+协同创新基地元宇宙实验室,加强产学研用深度结合,促进新业态发展 一、国家政策:产业发展的核心基础 元宇宙正逐步进入务实发展的新阶段,我国政策和产业规划与执行力强,对于全国一盘棋打造区域互通、企业融通的元宇宙空间有着天然的优势。这次《行动计划》出台,就是发挥有为政府和有效市场的合力,统筹发展和安全,系统性谋划和推进元宇宙产业落地,可谓正当其时、意义深远 二、基础设施:产业发展的基石 新业态新发展带来新挑战新机遇网 元宇宙 VR/AR 云游戏 元宇宙点云:5-100Gbps全息:5-50Gbps双向时延:趋向极限 高清/4K 8K@30fps VR视频:150Mbps双向时延(<20ms) 4K@60fps:55Mbps双向时延(<20ms) 4K@60fps:55Mbps时延(~1s) •超低时延,超大带宽•虚实间超强同步•超实时交互•随时随地接入•…… 大带宽 CDNCDN边缘能力下沉切片…… 元宇宙与移动通信网络发展进程互相匹配牵引、螺旋上升 通信网络的发展极大的提升了元宇宙的沉浸感体验,同时元宇宙对技术的高要求也牵引通信网络的发展 6G性能 5G-A性能 5G性能 下行峰值10Gbps上行峰值1Gbps下行体验1Gps上行体验百Mbps千亿物联超越联接稳定时延十倍能效 峰值速率:Tbps通感算融合太赫兹全频段组网 峰值下行3G+bps大上行750Mbps平均下行800M+bps超低时延6-7ms 标准引领、规模试验 技术策源、全面发力 技术先进、全球最大 •R18立项数居全球运营商首位•开展R17关键技术试验•构建全球首批5G-A产业数字化样板 •承担国家重大专项任务•主导ITU、IMT-2030、NGMN等行业组织的6G研究 •牵头5G国际标准项目210多个•多频协同、集约高效覆盖•累计开通5G基站达176.1万 算 元宇宙新业态对算力网络基础设施提出更高要求 元宇宙存在大量实时内容生成、画面渲染、XR和数字人等综合应用到AI、渲染技术的业务,其对分布式渲染、多集群协同调度和专用算力设施有极大需求,要求算力基础设施提供大型异构算力的集中化制作、渲染、AI训练生产能力。 •在国际电信联盟ITU-T大会中,研究院牵头的基于云边多媒体平台的数字人服务需求及架构项目(Requirements and Architectures of Cloud-edge BasedMultimedia Platform for Digital Human Services)在ITU-T SG16立项成功,提出云边多媒体平台架构,是元宇宙数字人应用与云边计算平台结合的全新探索 元宇宙之基:从算网融合基础设施走向一体服务 算力服务的提供离不开算力网络的支撑,算力网络新型基础设施需从算网融合迈向一体服务,利用边侧资源,端边协同一体化方案助力元宇宙灵活多样的端到端业务体验,降低元宇宙建设门槛 算网融合1.0构建算网融合服务 10用户只需要提出任务的具体需求(如输出60帧1080P视频)无需关注底层复杂的算网环境 元宇宙之智:AI赋能元宇宙 人工智能是元宇宙的基础使能技术,可赋能元宇宙数字内容的生产与治理。人工智能的机器视觉、智能语音、智能人机交互等技术,可用于数智人生成,并进一步赋予数智人听、说、看的基本能力 虚拟人生成、面部特点提取、表情迁移、唇音同步 Ø技术特点:基于先进的图像对抗生成、多模态融合等底层技术,通过面部人体关键点提取、表情迁移和唇音同步等模型来驱动虚拟数字人的面部和肢体活动,轻松一键生成栩栩如生的数字人视频 语音识别、语音合成、声纹识别、声源定位与分离能力 Ø技术特点:语音合成MOS得分达3.9;在线语音识别性能1核1.25路延时小于500ms;离线语音识别同步版1GPU卡可支持100路并发,RTF<0.1Ø能力场景:数智人播报 智能交互数智人 Ø技术特点:基于知识图谱、智能搜索、任务式对话、文档问答等NLP技术,实现从多元异构数据(表格、文档、图谱、问答对)到交互机器人的一键生成;智能搜索准确率:93.5%;图谱问答响应速度:46ms;知识图谱构建量:亿级 元宇宙之智:中国移动“九天“人工智能平台 自主构建的商用级“九天”人工智能平台可作为元宇宙的基础使能平台,目前已汇聚智能语音、机器视觉、自然语言理解、智能推荐等核心能力117个,服务104家内外部客户,日调用量100亿+,赋能价值31亿+ AIGC驱动数字原生内容创造,将极大推动元宇宙发展 AIGC将有望塑造数字内容生产和交互的新范式,成为数字内容生产基础设施,未来元宇宙中大量的数字原生内容将基于AIGC创作;chatGPT作为AIGC领域近期重大突破之一,大幅超越过去的AI问答系统,将极大的赋能数字人,提升智力水平对话水平 作为典型的文本生成式AIGC,chatGPT可以看作是GPT3.5版本,使用了人类反馈强化学习(RLHF)技术,能持续学习人类对回答的建议和评价,超更加正确的方向前进,用不到GPT3的1%的参数,从量变到质变,实现了极佳的对话效果,大幅超越过去的AI问答系统。 AIGC(AI Generated Content)是由AI生成的内容,其特点是自动化生产、高效。随着自然语言生成技术NLG和AI模型的成熟,AIGC逐渐受到大家的关注,目前已经可以自动生成文字、图片、音频、视频,甚至3D模型和代码。 •ChatGPT赋能数字人,将成为数字人的重要技术基础:chatGPT可以作为大型语言模型集成到各种数字人中,围绕NLP能力文本驱动,通过ASR-NLP-TTS进行感知-决策-表达的闭环驱动数字人交互,实现数字人高度逼真的语言对话能力,执行智能的复杂任务。目前国内多家数字人企业已经宣布集成chatGPT技术,Meta也提出了相应的智能助手创建计划。 •AIGC为构建沉浸式的元宇宙空间环境提供核心基础设施技术,将成为元宇宙的生产力工具,极大的提高构建质量和速度;•红杉资本在最近的研究报告中也指出,到2030年文本、代码、图像、视频、3D、游戏都可以通过AIGC生成,并且达到专业开发人员和设计师的水平。 •元宇宙中的数字人需要有更加自然、逼真的对话体验,ChatGPT可以为数字人提供这样的能力。同时,元宇宙和数字人的发展也可以为ChatGPT提供更加广泛、深入的应用场景,从而推动ChatGPT技术的进步。 •除chatGPT外,AIGC也会大大提升数字人的制作效能,实现数字人形象的快速生成、渲染和互动能力。 规 以分布式数字身份为基础,构建元宇宙信任体系 区块链构建的信任身份体系是元宇宙经济系统的基础,承载“数字人”身份及资产数据、信用数据等身份数据的集合,在元宇宙世界里用户真正拥有并控制自己的个人数据和资产,可实现跨体系、跨领域去中心化身份数据共享能力,实现数字世界中社交、生产、交易、创作等数字经济活动,元宇宙身份信任基础支撑元宇宙的经济系统搭建和运行 三、标准体系:技术储备和标准化布局 积极开展研究储备和标准化布局,在ITU,3GPP,CCSA等标准组织积极牵头立项和输入文稿,引导产业技术发展方向,以元宇宙算网增强、数字人、身份体系、沉浸式编解码等为撬动点,构建我司元宇宙技术领域技术引领优势 四、生态构建:面向中远期创新孵化 中国移动建设产业协同创新基地,包括5G/6G,算力网络,室内、室外、跨地域试验环境,并建设元宇宙实验室,汇聚“算、网、智、链、桥、魂、境”等要素,通过联合开发、演示、试点等手段,推动元宇宙关键能力成熟,培育元宇宙创新生态,并开展相关国际交流与合作 元宇宙实验室 四、技术生态:面向中远期创新孵化 由于元宇宙业务处于萌芽阶段,业务形式新,对业网算的需求复杂且多技术融合,需要内部多实验室和产业生态内多伙伴合作,建议前期收敛业务入口,通过统一的内部接口,对新业务进行业务测评和业务模型提取,实现多实验室的协同,沉淀开放共享的能力 产业合作生态 虚拟现实创新中心 咪咕 紫金创新研究院 中央美院 咪咕数智人 5G+VR教育 沉浸式艺术展 数字藏品发行 拓展5G+VR教育应用,智慧教室、远程教培等领域创新。 基于信息网络实现远程创作、远程传播及播放控制等技术 咪咕超写实数字人高精度模型、实时动态扫描、人脸拟合等。 基于区块链技术实现数字藏品发行能力(紫鲸) 云上内容创作 云渲染+泛在调度 大场景孪生建模引擎 数藏元宇宙展馆实现元宇宙空间下的数字藏品的展示展览。 面向城市级大场景,实现开放可用的孪生建模工具引擎,提升场景建模效率。 泛算调度平台赋能离线云渲染业务的达到资源快速扩缩,快速渲染的效果。 探索面向创作者经济的数字媒体商业模式。基于数字版权保护的新媒体技术 元宇宙新业务评测、业务模型提取-内部实验室接口