未来的语音世界 中国智能语音市场分析 2021年12月 目录 一、中国智能语音市场的机遇3 1.智能语音技术进入高峰期4 2.智能语音迈入商业应用阶段5 3.AI政策利好迎来全新发展机遇6 4.市场将维持高速增长7 5.生态圈呈现差异化竞争态势8 6.智能语音应用进入需求爆发期10 二、智能语音市场重点发展领域11 1.车载语音市场12 2.金融语音市场14 3.中国运营商语音市场16 4.智慧教育语音市场18 5.智慧医疗语音市场19 三、未来智能语音情境20 1.未来潜在驱动因素分析21 2.未来四个语音情境22 未来的语音世界中国智能语音市场分析|核心观点 核心观点 1.中国智能语音市场的机遇 •智能语音技术进入发展高峰期:随着新兴自然语言技术产生以及已有技术的不断成熟,智能语音技术已经从萌芽期迈入了成熟期,推动大规模的商业化应用落地。 •智能语音迈入商业应用阶段:智能语音技术发展已经历了萌芽、起步、产业化、应用落地四个阶段,未来将持续提高大量词汇连续语音识别性能,商业化产品将大规模出现。 •AI利好政策迎来全新发展机遇:智能语音应用落地方案得到了国家和地方政策的有力支持,中国已有超过20个省市出台了AI产业相关的利好政策,进而促使智能语音上、中、下游三方紧密结合,智能语音在内的AI产业链初步形成。 •智能语音市场维持高速增长:受益于成熟技术、政府/资本扶持以及智能化市场需求,中国智能语音市场规模将进一步增长,预计2030年市场规模将达到1,452亿元。 •智能语音生态圈呈现差异化竞争态势:现在越来越多的企业参与到智能语音赛道中,上游参与者正在不断提升竞争实力,打破语音算法和人工智能芯片瓶颈;中游参与者则依托技术优势布局下游应用场景,加速产品和服务在下游市场的渗透率。 •智能语音应用进入需求爆发期:在疫情的催化下,智能语音应用于日常生活(消费级)和特定场景(企业级市场)的需求比例正在不断扩张,预计2030年消费级应用场景超过710亿元,企业级场景将达到740亿规模。 2.智能语音市场重点发展领域 •中国车载语音市场: –智能驾驶下智能语音交互应用沉浸增强:成熟的语音技术和消费者高接受度使车载智能语音迅速发展。另外,智能网汽车的操作系统升级使语音交互更加丰富,用户可通过智能语音系统实现娱乐、辅助驾驶、获取信息和解决方案等多种功能。 –车载语音市场竞争激烈,国产品牌竞争力显着提升:中国车载语音市场仍以国内品牌主导,对中国用户使用习惯和需求的掌控促使他们引领车载语音技术发展。市场的竞争也逐步聚焦于核心技术和用户体验,激烈竞争局势加剧了行业的优胜劣汰。 –车载语音市场细分程度加深,生态系统仍需完善:多模态交互和基于车辆为重心的生态系统建设是未来重要发展方向,其一,融合语音,手势识别、眼球追踪、AR/VR等多模态交互形态,其二,将车辆传感器、用户个性、环境交互和互联网生态充分融合。 •中国金融语音市场: –金融行业智能语音客服场景发展迅速:受益于人工智能技术,金融业的客服中心正在从“成本中心”转化为“利润中心”,重点推动语音客服、语音智能投顾、语音识别认证等技术的研究与应用,进而帮助金融行业带来产业创新和升级。 –智能语音市场可拓展营收空间潜力巨大:当前金融行业的智能客服已经从单一的语音识别合成向语音加语义的智能化语音系统转型,未来还将建立企业级知识库、千人千面标签体系和智能语音助手,实现无障碍化和强针对性的客服问答和业务办理。 1 未来的语音世界中国智能语音市场分析|核心观点 •中国运营商语音市场: –智能语音技术赋能智慧通信:各网络巨头及传统终端设备厂家积极通过智能语音积极布局智慧家庭,如三大运营商加速布局智能机顶盒升级和语音遥控器产品。与此同时,积极构建智能呼叫中心系统和加速智慧通讯升级。 –更多技术赋能运营商语音市场:运营商将加强与技术类企业合作,另外,5G等新技术进一步推动智慧通讯,网络承载内容更加丰富多彩且具有个性化。 •中国智慧教育市场: –政策助推智慧教育发展:国家教育部及国家标准委员会相继推出智慧教育政策和标准,加速智慧校园建设和覆盖,与此同时,疫情期间“停课不停学”新政使教学全面线上化。另外,受益于新高考方案和国家英语能力考试改革,智能语音测评市场潜力巨大。 –智慧教育下游产业链从B端向C端延伸:“后疫情+双减”的背景下,智慧学校(因材施教解决方案)加速布局,适用于家庭场景的学习机需求趋于刚性。 •中国智慧医疗市场: –利好政策环境快速推动智能医疗发展:以“电子病历”为核心的信息化建设相关利好政策密集出台促使顶层架构逐步完善,电子病历、智慧服务、智慧管理“三位一体”的中国智慧医疗建设发展正在全面铺开且渐入佳境。 –智能语音机器人赋能医疗领域和健康管理领域:利用语音识别和自然语音处理技术赋能问诊机器人、心理健康咨询机器人和养老陪伴机器人,其一,实现患者导诊和问诊服务,其二,满足老年人陪伴和精神需求。 3.智能语音未来场景 •智能语音正在从消费级应用场景扩展到专业级应用场景,科技、政治、环境、经济和社会四方面因素与语音应用场景具有紧密联系,也将在不同程度上影响智能语音场景化的应用。 •“交互大军”、“技术输出”、“资讯同步”和 “搜索革新”是未来语音的四种可能情境,其中交互大军(智能语音交互)已位于赛道前端,技术输出作为功能性主流应用将具有巨大潜力,未来将大范围应用于专业级场景,尤其是在教育和医疗具有较大增长潜力。 2 一、中国智能语音市场的机遇 1.智能语音技术进入高峰期 智能语音主要研究如何通过语音实现人机交互,相关支撑技术主要可分为基础语音技术、智能化技术以及大数据技术。整体来看,多数语音技术已经进入稳步爬升期,甚至语音识别技术已经处于生产成熟期,这意味着智能语音技术逐渐成熟。与2018年相比,许多新兴自然语言技术产生,同时已有技术的成熟度都有很大程度的 提升,从技术萌芽期进入更成熟的阶段。例如,对话式人工智能平台和对话机器人经过三年的发展,技术成熟度持续提高;而语音识别技术作为一个成熟度智能语音技术维持在生产成熟期,可以稳定用于各领域应用。智能语音技术经过近几年的发展已进入高峰期,将进一步推动智能语音的市场规模扩大及商业化应用落地。 图:语音技术的成熟度曲线,2021 自然语言生成 转换器 对话机器人 文本归纳情感人工智能自适应PEMT 自然语言生成 预计达到稳定阶段: <2年2-5年 5-10年 >10年 2018年技术成熟度 对话式人工智能平台 虚拟助理 自然语言理解智能文档处理 语音分析 语音识别 文本分析 语音识别 对话式人工智能平台 NSLMs 语音合成 洞察力引擎神经机器翻译 开源的NLP工具包文本自动分类 语义搜索 对话机器人本体论和 知识图谱 生产成熟期 稳步爬升恢复期 泡沫破裂低谷期 期望膨胀期 技术萌芽期 资料来源:Gartner,德勤研究 2.智能语音迈入商业应用阶段 人工智能核心技术涵盖了机器视觉、智能语音和机器学习。作为人工智能的重要入口,智能语音包括语音识别、语义理解、自然语言处理(NLP)、语音交互等。当前,智能语音技术的发展经历了萌芽、起步、产业化、应用落地四个阶段。在萌芽阶段,智能语音技术主要以模板匹配的方法实现,此阶段的主要特点是系统只能识别孤立的数字以及有限的词汇。而到了起步阶段,系统从识别孤立的语音数字发展到可以通 过对声音的模式和特征设置参数,从而实现基于大量词汇进行连续的语音识别。随着语音识别转向基于概率统计建模的方法,智能语音迈入产业化阶段。在此阶段,各种语音功能及语音产品问世。而目前,智能语音处于应用落地阶段。深度神经网络方法应用于语音识别,显着提升了大量词汇连续语音识别性能。由于智能语音系统的深度学习技术取得突破性进展,开始大规模出现商业化应用落地的产品。 图:智能语音发展四阶段 萌芽阶段 起步阶段 产业化阶段 隐马尔科夫模型可训练的语音 (HMM)和高斯合成方法提出,混合模型(DMM)适合嵌入式设 应用落地阶段 语音合成的参数 合成法出现能合成出比较自然的语音 应用,语音识别转向基于概率统 计建模的方法 备应用 基于简单的模板匹配的方法 进行针对特定的孤立数字语音识别出现 基于大词汇量的 连续语音识别系统开始出现 科大讯飞首个 深度神经网络中文语音识别系统上线基于 语音合成PSOLA算法被提出,DNN的声纹识 别率提升了技 解决了语音段的拼接问题术变迁30% •端到端的语音识别广泛应用,准确率进一步提升 •远场语音识别和唤醒进一步发展 •全双工语音交互出现 模板匹配方法主导 模式和特征分析方法主导 概率统计建模方法主导 深度神经网络方法主导 资料来源:iResearch,德勤研究 3.AI政策利好迎来全新发展机遇 除了技术的成熟之外,智能语音应用落地也得到了政策方面的大力支持。从国家性政策来看,政府的利好政策频出,进一步推进人工智能技术与各应用领域的深度融合。随着“十四五”规划将人工智能列为前沿科技领域的“最高优先级”,包括智能语音在内的人工智能产业及相关业务将受到政府支持,进一步迎来有利宏观环境。从地方性政策来看,随着中央政府在人工智能领域 利好政策的陆续出台,各地方政府对于人工智能产业也日益重视,政策性支持日益增加。截至目前,中国已有超过20个省市出台了人工智能产业相关的利好政策,其中全国人工智能先导区由上海(浦东新区)、深圳、济南-青岛3个,加入北京、天津(滨海新区)、杭州、广州、成都增至8个,表明更多的地方政府开始重视并大力支持包括智能语音在内的人工智能产业的发展。 智能化应用《关于进一步优化地方政务服务便民 热线的指导意见》 提出加强自助下单、智能文本客服、智能语音等智能化应用,方便企业和群众反映 诉求建议 智能家居 智能政务 《关于政协十三届全国委员会第三次 会议第5148号提案答复的函》 《最高人民法院关于深化人民法院司法体制综合配套改革的意见》 鼓励智能家居产品普及语音控制功能,推动基于智能语音识别技术的智能音箱、 智能可穿戴设备及其他智能家电产品开发,老年人可通过语音方式实现便捷化操作 全面提升语音识别技术在庭审语音同步转录中的应用效能,建成全国法院智能语音云平台,实现全国法院语音识别的模型共享和统一管理 智能化应用《关于开展2018年人工智能与实体经重点支持智能医疗影像辅助诊断系统、视频图像身份识别系统、智能语音交互系统、济深度融合创新项目申报工作的通知》智能翻译系统和智能家居产品等研发和应用 天津市 《天津市新型基础设施建设三年行动 方案(2021—2023年)》 强化“津治通”平台支撑能力,引入智能视频识别和智能语音服务,提升数据支 撑决策能力和平台指挥调度能力 河北省 《廊坊市人民政府办公室关于促进 “互联网+医疗健康”发展的实施意见》 鼓励医疗机构探索开展智能医学影像识别、病理分型和多学科会诊以及多种医疗 健康场景下的智能语音技术应用、提高医疗服务效率 内蒙古 《内蒙古自治区国民经济和社会发展第 十四个五年规划和2035年远景目标纲要》 支持北斗产业化及规模化应用,大力布局和发展智能语音识别技术,建设内蒙古 数字小语种人工智能翻译中心、云端机器人运营中心 山西省 《晋中市人民政府办公厅关于印发晋中 市促进信息消费实施方案的通知》 提出加强智能终端、智能语音、信息安全等关键软件的开发应用 国家政策 图:智能语音产业相关国家政策 地方性政策 资料来源:德勤研究 在国家政策以及地方配套政策的推动下,包括智能语音在内的人工智能等领域产业链逐步形成并初具规模,大型互联网公司及专业的智能语音企业与产业下游应用领域的结合不断深入,加速推动各领域从数字化、网络化向智能化发展。 4.市场将维持高速增长 智能语音技术的成熟、政府和资本的扶持与重视以及数字化、智能化的市场需求不断扩大,中国智能语音行业市场规模将进一步增长,预计在2030年市场规模将达到1,452亿元。 图:中国智能语音市场规模及增速 300 25041% 2