作者 摘要 唐文卿 2023年中国对话式AI行业词条报告 近年来随着人工智能的快速发展,NLP的对话和问答能力渐趋成熟,对话式AI逐渐成为智能语音语义领域的焦点。对话式AI是通过语音语义技术理解人类意图进行理解,进而执行任务或作出回答。在深度神经网络助力下,对话式AI的应用效率显著提升。对话式AI的产品形态日渐丰富,应用场景及功能不断拓宽与深化在疫情催化下,各行业数字化、智能化应用迎来需求拐点,对话式AI行业发展进入需求爆发期。消费级场景来看,智能硬件语音交互所搭载的算法将成为硬件智能化的基础标配,随着AIoT和5G的技术发展,智能硬件市场需求激增将驱动中国语音助手市场规模爆发;企业级场景来看,AI技术的快速发展推动对话式AI应用边界拓宽至营销、销售、客服等场景,将逐渐取替传统客户软件市场,预计未来企业级市场的商业化需求将进一步释放 行业头豹分类/综合及概念/其他港股分类法/信息科技/软件服务 关键词对话式AIAI技术 1.对话式AI行业定义 AI语音技术的迅猛发展逐步变革人们的生活方式。对话式AI系统是通过ASR语音识别、NLP自然语言处理、TTS语音合成等语音语义技术,根据对人类语言中的意图进行理解并执行相应任务或作出回答的系统。此外,通过结合NLP与机器学习,不断升级迭代AI算法,帮助模仿人类交互,实现高效智能的交互服务,如智能语音助手、聊天机器人等 2.对话式AI行业分类 对话式AI系统的产品形态包括文本机器人、语音机器人、以及迭代的多模态数字人;而按不同意图的业务场景,对话式AI系统可分为任务型、问答型和闲聊型对话式AI系统 类型名称 类型说明 文本机器人 文本机器人是基于知识图谱技术和NLP技术,理解客户语义并进行对话推理与决策,辅助人工以文本问答形式回复用户 语音机器人 语音机器人是在文本机器人的基础上结合语音识别、语音合成等语音语义技术,以语音形式回复用户,业务场景拓宽至智能回访、智能客服和智能营销等 多模态数字人 多模态数字人是继语音机器人之后的产品升级迭代,在文字和语音基础上,结合计算机视觉和多模态技术,融合虚拟人形态,以仿真人形式实现智能化交互服务 问答型对话系统 问答型对话系统是基于检索模型,通过预设问答对集合,再寻找用户问句语义最相近的标准问句,回复答案给用户 任务型对话系统 任务型对话系统是识别意图后,通过多轮对话交互,把用户的需求表达完整,得到结构化的完整信息,进而请求服务完成反馈 闲聊型对话系统 闲聊型对话系统是面向发散领域,通过检索闲聊库答案的检索式或从闲聊库生成模型的生成式,满足对话需求 3.对话式AI行业特征 伴随智能语音语义技术的持续突破,对话式AI产品形态日益丰富,其应用场景不断拓宽以及功能也持续深化,覆盖更广泛的业务场景。在疫情催化下,各行业数字化、智能化应用迎来需求拐点,加之政府相关政策的驱动,对话式AI行业发展进入需求爆发期,同时相应的吸引了越来越多互联网科技巨头厂商 的布局,市场竞争将加剧。 按客户类型分为消费级市场和企业级市场 多元化使伴随智能语音语义技术的持续突破,对话式AI产品形态日益丰富,其应用场景不断拓宽以及功能也持续深化,覆盖更广泛的业务场景。按用场景客户类型分为消费级市场(ToC/ToBToC)和企业级市场(ToB)。消费级市场应用主要围绕日常生活应用场景,企业级市场应用领域覆 盖智慧医疗、智慧金融/电商/电信、智慧教育、智慧政务等。 互联网科技巨头厂商纷纷跨界布局,市场竞争将加剧 市场竞争随着AI语音智能化程度提升,对话式AI产品交互体验大幅提升,大众认知和习惯渐趋培养,智能交互产品市场需求的激增,不同厂商以差 加剧异化策略切入市场竞争。中国AI语音技术专利合计1.75万件。Top10专利申请量主体均为厂商,可见对话式AI相关技术进入成熟期,厂商 申请研发布局更为活跃从Top10厂商来看,互联网科技厂商过半。进入Top3厂商包括腾讯(3,762项)、百度(3,632项)、平安(1,377项),其中百度、腾讯占据显著的领先优势。 政策驱动 国家政策规划驱动技术发展,政策拉动对话式AI的应用需求 发展对话式AI行业发展迎来政策“组合拳”,国家政策规划驱动智能语音技术发展的同时,政策拉动对话式AI的应用需求。政策既驱动行业级企 业数字化转型的需求,也鼓励消费级智能家居硬件产品的普及。 对话式AI发展历程 4. 语音识别技术自20世纪50年代步入萌芽阶段,发展至今主流算法模型经历了四个阶段:包括模板匹配阶段与模式和特征分析阶段、概率统计建模阶段、深度神经网络阶段和技术融合阶段,其中深度神经网络使得智能语音技术发生质的突破 目前,AI语音厂商主要使用端到端算法,在理想环境下语音识别准确率高达98%以上,对话式AI实现规模化应用。2020年,疫情激增对话式AI应用需求, 智能语音发展进入技术融合阶段,形成行业多维技术解决方案 开始时间:1950结束时间:1980阶段:萌芽期 行业动态:贝尔研究所Davis等人研究成功了世界上第一个能识别10个英文数字发音的实验系统,能够理解口头数字的机器Audrey。1960年英国的Denes等人研究成功了第一个计算机语音识别系统。 行业影响/ 阶段特征:该阶段语音识别主要是基于模板匹配的方法识别有限的词汇以及数字;系统处于研究和探索阶段 开始时间:1980结束时间:2000阶段:启动期 行业动态:研究的重点逐渐转向大词汇量、非特定人连续语音识别。在研究思路上也发生了重大变化,即由传统的基于标准模板匹配的技术思路开始转向基于统计模型(HMM)的技术思路。此外,再次提出了将神经网络技术引入语音识别问题的技术思路。同时,在语音识别技术的应用及产品化方面出现了很大的进展。 行业影响/ 阶段特征:隐马尔可夫模型和高斯混合模型应用,该阶段语音识别转向概率统计建模的方法,语音合成PSOLA算法攻破拼接问题 开始时间:2001结束时间:2019阶段:产业化期 行业动态:2010年,机器学习算法和计算机性能的进步带来了更有效的训练深层神经网络(DNN)的方法。因此,语音识别系统开始使用DNNs,更具体地说,是使用一种DNNs的特殊变体,即循环神经网络(RNNs)。此后,基于RNNs的模型表现出比传统模型更好的精度和性能。2016年的语音识别准确度达到了90%。 行业影响/ 阶段特征:深度神经网络DNN在语音识别领域占据主流地位,语音识别准确率大幅提升;同时,语义技术飞速发展,智能语音进入产业化阶段 开始时间:2020结束时间:2022阶段:融合发展期 行业动态:端到端的语音识别开始广泛运用,针对远场的语音识别和唤醒得到进一步发展,全双工语音交互开始出现,此阶段的语音识别准确率可达98%以上,且能根据实际应用痛点针对性优化。 行业影响/ 阶段特征:语音识别准确率高达98%,端到端语音识别广泛应用。语音识别作为对话式AI的入口,广泛应用于多场景。对话式AI实现规模化落地 对话式AI产业链分析 5. 中国对话式AI行业的产业链上游为基础设施与智能语音技术提供商,中游为IT互联网厂商和AI语音技术厂商,厂商将AI语音技术集成于平台/解决方案,并服务于各行业场景的企业级和消费级终端用户。伴随智能语音语义技术的持续突破,其应用场景不断拓宽以及功能也持续深化,覆盖更广泛的业务场景。在疫情催化下,各行业数字化、智能化应用迎来需求拐点,对话式AI行业发展进入需求爆发期。 在政策规划、标准体系支撑下,对话式AI架构链条逻辑上分为基础层、技术层、产品层、应用层五大板块。其中技术层是语音交互的处理过程,AI技术的快速发展推动商业化应用。产品和应用层是厂商把AI语音技术集成于平台/解决方案。 阿里云计算有限公司、百度云计算技术(北京)有限公司、华为云计算技术有限公司、腾讯云计算(北京)有限责任公司、北京金山云网络技术有限公司、中国移动通信集团有限公司、中国电信集团有限公司、中国联合网络通信集团有限公司、乐鑫信息科技(上海)股份有限公司、晶晨半导体(上海)股份有限公司、科大讯飞股份有限公司、思必驰科技股份有限公司、北京容联易通信息技术有限公司、北京易掌云峰科技有限公司、深圳市云之讯网络技术有限公司、北京爱数智慧科技有限公司、北京海天瑞声科技股份有限公司、云知声智能科技股份有限公司、北京捷通华声科技股份有限公司、北京搜狗信息服务有限公司、北京京东科技有限公司 AI技术的快速发展推动商业化应用,其中人机对话技术以语音、语言和知识处理技术为基础,对话式AI底层核心技术包括智能语音技术、自然语言处理、结构化知识库、深度学习等。技术的质量将会直接影响到人工智能产业链内企业的研发周期、产品性能和可扩展性。 基础设施与智能语音技术提供商 上游参与方 上游说明 上游环节 中游环节 中游说明 中游参与方 IT互联网巨头厂商和AI语音技术厂商 对话式AI行业中游主要包括IT互联网巨头厂商和 阿里云计算有限公司、百度云计算技术(北京) AI语音技术厂商两大类,行业呈现差异化竞争态 有限公司、北京京东科技有限公司、腾讯云计算 势。互联网巨头厂商基于C端优势推动产品创新 (北京)有限责任公司、北京搜狗信息服务有限 及落地,AI语音技术厂商凭借技术优势积极布 公司、小米科技有限责任公司、科大讯飞股份有 局各行业场景。对话式AI行业的主要商业模式包 限公司、北京捷通华声科技股份有限公司、思必 括以调用量收费(API、SDK)和以软硬件解 驰科技股份有限公司、竹间智能科技(上海)有 决方案收费两种方式,业内主流收费方式分为按 限公司、上海图灵智造机器人有限公司、北京声 一次性收费和周期内按授权收费。 智科技有限公司、云知声智能科技股份有限公司、浙江百应科技有限公司 小米科技有限责任公司、科大讯飞股份有限公司 、阿里云计算有限公司、百度云计算技术(北京)有限公司、北京京东科技有限公司、腾讯云计算(北京)有限责任公司 对话式AI行业下游应用按客户类型分为消费级市场和企业级市场。对话式AI下游应用持续拓宽,功能服务不断深化,场景变现能力增强,市场应用需求将进入爆发期。消费级市场应用主要围绕日常生活应用场景,核心技术是智能语音语义赋能终端硬件设备,实现各生活场景下的语音交互。企业级应用场景在疫情的催化下加速拓宽,业务场景也持续深化,业务场景从智能客服、智能外呼延伸至智能营销和企业服务场景。 应用场景 下游参与方 下游说明 下游环节 对话式AI行业规模 6. 中国对话式AI行业按产品服务划分为对话机器人和智能交互硬件搭载的语音助手。其中,对话机器人市场规模按业务模式划分为软件、硬件、支持服务,智能语音助手市场规模为智能硬件中智能语音交互的算法部分产值。 2021年中国对话式AI行业市场规模为82.7亿元,随着智能语音技术升级迭代,对话式AI的产品形态日渐丰富,应用场景及功能服务不断拓宽与深化,未来 5年行业市场规模将呈现快速增长态势。2026年中国对话式AI行业市场规模将实现跨越式增长,5年CAGR达26.3%,行业呈现快速增长态势。中国对话式AI行业进入迅猛发展阶段,下游市场需求增长带来强大的增长动能 中国对话式AI行业市场规模,2019年-2026年预测 对话机器人市场空间=软硬件市场规模+支持服务产值 智能语音助手市场空间=智能硬件语音交互所搭载的算法产值 中国对话式AI行业市场空间=对话机器人市场空间+智能语音助手市场空间 《中国智能语音市场分析》、《百度大脑智能对话引擎白皮书》、头豹研究院 对话式AI政策梳理 7. 政策名称:《国家新一代人工智能标准体系建设指南》颁布主体:中央网信办等五部生效日期:2020-08影响:6政策性质:规范类政策 政策内容:为加强人工智能领域标准化顶层设计,推动人工智能产业技术研发和标准制定,促进产业健康可持续发展。关键领域技术标准主要包括自然语言处理、智能语音、计算机视觉、生物特征识别、虚拟现实/增强现实、人机交互等部分 政策解读:通过对人工智能产业技术研发和标准的制定,将促进产