中国移动视联网白皮书 (2024年) 中国移动通信集团有限公司编制单位:中移智库 前言 视联网是促进数字经济生活、生产全面升级的新型视频信息服务基础设施,是深入CHBG行业应用的新生产要素,为各行各业的数智化转型提供强大动力,并为数字中国的高质量建设提供有力支撑。本白皮书旨在结合中国移动及产业内合作伙伴对于视联网发展 背景及意义、典型应用场景、发展现状及趋势、体系架构及关键技术的分析,展望视联网的发展愿景,并提出视联网产业推进倡议,希望为视联网相关技术、产品及解决方案的发展与落地提供参考与指引。 本白皮书的版权归中国移动所有,未经授权,任何单位或个人不得复制或拷贝本文之部分或全部内容。 目录 1.背景及意义1 1.1视联网简介1 1.2视联网的发展历程2 1.3国内外相关政策及发展规划3 1.4发展和应用视联网的重大意义4 2.视联网典型应用场景5 2.1公共服务类5 2.2企事业业务类13 2.3家庭家居类21 3.视联网发展现状及趋势24 3.1视联网发展现状24 3.2视联网发展趋势25 4.视联网体系架构及关键技术29 4.1体系架构29 4.2关键技术30 5.发展倡议42 5.1愿景与展望42 5.2推进倡议42 缩略语列表44 参考文献45 编写单位及作者46 I 1.背景及意义 1.1视联网简介 随着5G网络、视频、AI等技术普及,那些神话故事中“瞰千里之目、察万里之毫”的畅想成为了现实。视频数字化应用也从传统的视频监控向能够承载更泛在化、多样化、基础化、能力化的视联网演进。 当前狭义的视联网主要指视频监控联网系统,将独立的视频监控前端设备通 过标准的网络协议和技术手段,连接到统一的管理平台或云端系统上,面向安防监控场景实现跨地域、跨系统的互联互通、集中管理和信息共享。 而广义的视联网是指以视频通信技术为基础,IoT连接为载体,融合云计算、通信、AI、大数据等技术,面向视频监控、视频会议、视频对讲等泛视频业务场景提供视频采集、传输、存储、分析、呈现等全链路处理能力的视频信息服务基础设施。具有高速泛在、云网融合、智能敏捷、安全可控等特点,并对促进数字经济生活、生产、治理全面升级具有重要意义。 视频已经成为人们获取信息、娱乐休闲的主要方式,以视频为主要信息传递介质和功能载体的需求不断增长,人们对视频的需求已经从简单的观看发展到对交互体验、内容理解、辅助决策等方面的更高要求,也推动了视联网的进一步发展。同时,随着社会的数字化和智能化转型,越来越多的行业和领域开始融入视频应用技术,如智慧家庭、城市综治、数字乡村、智慧社区、智慧商铺、交通出行等,为视联网的发展提供了广阔的应用场景和市场空间。 当前视联网的的发展背景融合了多方面的时代特征与社会需求,既体现了科技进步对社会治理方式的巨大推动力,又反映出人类社会在追求安全、品质生活、便捷与公平正义价值取向上的深刻变革。 1.2视联网的发展历程 图1视联网发展历程 视联网的发展历程大致可分为三个发展阶段:阶段一:模拟/数字时代(“十三五”以前) 在模拟/数字时代,最初以模拟设备为主,通过同轴电缆作为传输媒介。这个阶段由监控主机负责控制、传输和录像存储。随着数字化的升级,视频矩阵、硬盘录像机和磁带存储设备等都进行了数字化升级改进。在这个阶段,视频能力、可扩展性和图像质量都有所提高,但仍然仅能满足行业需求的“看得见”层面。阶段二:万物互联时代(“十三五”) 随着通信技术和数字视频技术的进一步发展,在该阶段视频设备具备了更强的异构网络接入和多维感知数据采集能力,通过设备间的各类信息共享和相互交互,实现了自动化、智能化的视频和各类感知数据全域联网功能。随着H.264、HEVC等视频编码技术的出现,高清视频图像经过压缩后,视频设备具备了更强的远距离网络传输条件。这使得行业需求得到了进一步的满足,不仅“看得见”,而且“看得清”、“看得全”。 阶段三:智联孪生时代(“十四五”) 随着深度学习技术的兴起和算力的提升,视频通过深度神经网络可以学习到图像中的特征和模式,将图像进行分类、识别和理解,更好的帮助人们进行辅助判断和智能决策;而数字孪生技术则可将现实世界中的物体、系统或过程以数字化形式进行建模、仿真和监测,帮助人们在视联网内实现与现实世界的沉浸式虚实交互。两者相融合,这使得视频设备能够同时满足行业对“看得懂”、“能预见”和“身临其境”的需求,大大提升社会治理能力和管理效率。 1.3国内外相关政策及发展规划 视联网作为信息技术领域的重要组成部分,受到了全球多国政府和组织的高度重视。各国在推动视联网技术发展和应用方面,出台了一系列政策和规划,以期加速这一领域的创新和成熟。 我国多部委政策频出,在公共安防、数字经济、5G基建等方面,鼓励视联 网产业的发展。2019年2月,工业和信息化部、国家广播电视总局、中央广播电视总台联合印发《超高清视频产业发展行动计划(2019-2022年)》,明确夯实超高清视频产业核心基础,丰富超高清视频内容供给,提升网络传输能力,加强行业推广应用,完善公共支撑体系,全面促进我国超高清视频产业快速发展;2021年7月工信部《5G应用“扬帆”行动计划(2021-2023)》明确加大超高清视频监控在城市安防方面应用;2021年12月,国务院印发的《“十四五”国家应急体系规划》明确加快汇聚视频监控数据;《“十四五”数字经济发展规划》明确发展沉浸式视频等新业态;2022年5月,中央办公厅《关于推进以县城为重要载体的城镇化建设的意见》明确重点推进视频安防的应用渗透;2023年12月工业和信息化部、教育部、商务部等七部门联合印发了《关于加快推进视听电子产业高质量发展的指导意见》,明确提出要推动智能音视频采集系统在各行业应用,支持建设云网边端协同视联网平台,服务社会数字化治理。各级政策的相继推出也为视联网的发展带来了新机遇。 国外政府和企业也将视联网纳入物联网的整体发展战略积极进行布局。欧盟在2009年发布了“物联网行动计划”,旨在推动物联网技术在能源、交通、环保、医疗等领域的应用,并先后在2015年成立“物联网联盟(AIOTI)”、2016年启动“物联网欧洲平台倡议(IOT-EPI)”和物联网大规模试点计划。美国在2020年通过《促进物联网创新和发展法案》,确认适当的优先事项、频谱规划,积极推动物联网技术创新和应用,并在同年出台《物联网网络安全改进法案》,成为全国性法律。日本和韩国两国也都将物联网作为重点发展的战略性新兴产业,日本政府发布《新产业结构战略》,将物联网作为国家战略重点发展领域之一,提出了加快发展的目标和任务。韩国出台了《基于IP的传感器网基础设施构建基本规划》,将物联网确定为新增长动力。国外科技巨头们则在相关产品和 技术领域加速布局,2023年2月,google提出了视觉大模型ViT-22B,具有22亿参数,并且评估结果进一步表明,与现有模型相比,ViT-22B在形状和纹理偏差方面显示出与人类视知觉更多的相似性,视觉感知力直逼人类,并且在公平性和稳健性方面提供了优势,有望为视联网提供更强的感知能力。2023年4月,Meta宣布推出AI模型SegmentAnythingModel(以下简称“SAM”),被业界认为是“计算机视觉领域的ChatGPT”,并对SAM模型从数据集到训练代码和预训练结果进行完全开源,有望推动视联网的智能化实现跨越式发展。2023年6月5日,苹果公司在WWDC23开发者大会上发布了其首款头显设备AppleVisionPro,凭借更易用的空间操作系统、更强的计算和显示能力、更自然的人机交互,引领VR虚拟现实产业进入空间计算的新时代,或将探索作为视联网家用终端孵化更多的创新应用场景,推动产业加速发展。 随着政策的不断完善和技术的逐步成熟,视联网将在更多领域展现出更大的潜力和价值,影响并改变现代社会。 1.4发展和应用视联网的重大意义 视联网是当下科技创新最活跃的重要赛道之一,融合了大数据、人工智能、安全、能力中台、算力网络、6G等“BASIC6”中的各项关键技术,成为新一代信息通信领域中一个重要分支,其发展与国家战略新兴产业的关系十分紧密,是推动国家战略新兴产业发展、加快形成新质生产力的重要力量之一。同时,视联网汇聚了海量的数据资产,通过与大数据和AI技术的完美融合,可为各行各业的数智化转型注入强大动力,并为数字中国的高质量建设提供有力支撑。 视联网将作为经济社会数字化“眼睛”,可在家庭防护、智慧城市、智慧教育、工业控制、远程医疗等领域开拓出诸多创新场景,赋能视频服务从“看得见”向“看得深”、“看得懂”、“能预见”、“身临其境”的多维智能感知演进。 2.视联网典型应用场景 视联网技术通过提供高清、实时的视频通信能力,将大大提高人们沟通的效率和质量,无论是在公共服务场景中的安全监控、智慧调度及应急响应,还是在企事业业务场景中的安全防范、监控预警及生产提效,以及在家庭家居场景中的家人看护、家庭娱乐及家庭服务。视联网都能够提供比传统视频通信方式更加直观、高效、智能的视频服务能力及交互体验。结合视联网当前落地的商业场景及未来服务的业务场景,我们认为视联网将在公共服务、企事业业务及家庭家居三大类共18大典型应用场景中加速落地。 图2视联网典型应用场景 2.1公共服务类 2.1.1城市综治 城市综治以建设城市视频监控资源为基础,密切联系城市安防实战的应用需求,利用先进的信息和通信技术手段,实现城市各个领域的智能化管理和服务,提高城市运行效率、改善居民生活质量、增强城市的可持续发展能力。 场景一:智能交通管理 通过在城市道路和交通节点安装高清摄像机,能够实时监测交通流量、车辆速度及违规行为。当发生交通拥堵或事故时,迅速作出响应,调整交通信号灯的配时,优化交通流线,有效缓解交通压力。 场景二:环境保护与监测 随着城市化的加速,环境保护问题日益凸显。可利用视联网的多元感知技术,对城市的空气质量、水质以及噪声污染进行实时监测。通过在关键区域安装监测设备,能够收集并分析环境数据,一旦发现异常情况可立即采取相应的治理措施。 场景三:城市应急响应 在应对突发事件时,视频监控技术发挥着至关重要的作用。无论是自然灾害、安全事故还是公共卫生事件,都能够通过实时视频监控,全面掌握事件的发展态势和影响范围。 图3城市综治应用场景(城市管理、应急响应、卫生监测) 2.1.2数字乡村 数字乡村是乡村振兴的战略方向,也是建设数字中国的重要内容,重点围绕“基础设施升级、产业振兴、业态创新、乡村治理、信息惠民和生态宜居”等几类业务,利用全面感知能力,围绕农业、农村、农民及政府的不同需求提供相应的视联网解决方案,助力缩小城乡数字鸿沟,平衡城乡资源,最终实现农业强、农村美、农民富。 场景一:安全隐患预警 为了提升安防治理水平,通过部署智能摄像机,基于手机APP、互联网等工具,外出的村民通过手机可以远程探望家里老人及孩子的情况;村委干部通过村委综治大屏或手机直观查看监控画面,掌握区域动态,提高治安综合管理水平。 场景二:智能环境治理 在智慧乡村中,环境治理变得智能高效。高清摄像机和智能传感器被安装在 关键区域,实时监控环境状况,通过AI算法识别乱丢垃圾、违规焚烧等行为,提醒村民注意,并通知管理人员进行及时处理。既提高了环境治理效率,又培养了村民的环保意识。 场景三:智慧农业管理 智慧乡村借助物联网技术,实现对农田的精准管理。通过智能传感器,实时监测土壤湿度、温度等参数,为农民提供科学的种植建议。同时,无人机等先进设备也被应用于农药喷洒、作物监测等方面,大大提高了农业生产的效率和质量。 场景四:产业发展促进 在产业发展方面,通过数字化技术可促进农产品的品质提升和溯源管理,结合智能视频监控技术可实现农产品的生产、流通和销售环节被全程监控和记录,确保产品质量和安全,增加消费者对农产品的信任度,推动乡村品牌的建设。 图4数字乡村应用场景(乡村公共区域、池塘、农田) 2.1.3交通出行 随着城