编制声明 本白皮书版权属于人工智能产业发展联盟(AIIA)-得意音通人工智能声纹技术联合实验室和清华大学人工智能研究院听觉智能研究中心。文中部分数据来 源于网络公开资料整理,转载、摘编或利用其它方式使用本白皮书文字或观点的, 应注明来源。违反上述声明者,编者将追究其相关法律责任, 主编 郑方孙明俊 编写组 成王钰李钰韩程星亮徐明星王蕴韬 曹峰李苏宋丹峰杨悦倪鸣陈柳村 周鑫鄂晓钧肖永明向银杉高锯刘彦全 序言 自上世纪四五十年代以来,经过长时间的探索实践,声纹识别技术终于逐渐走向成熟,迎来了历史上最佳的应用发展期。这一改变,首先发生在中国。2018年可以说是声纹识别迈向产业化的分水岭,其标志性事件莫过于中国 人民银行颁布的《移动金融基于声纹识别的安全应用技术规范》。这是我国金融行业第一个生物识别技术标准,其影响之深之广,远超我们的预期。它不仅为声纹识别技术进入金融领域突被了标准难题,也为多年来一直坚持初心的业界 同仁注入了一针强心剂,2018年因此被称之为“声纹元年"。 声纹开始热了,产业态势已成,孤军奋战的日子一去不复返。再好的科研 成果,只有从象牙塔里走出来,放到实践中去检验,才能发光发热,造福社会。作为行业老兵,我们感到欣慰,因为这证明了我们当初的判断和坚持是正确的。但我们同样也有担心,如果一个刚发芽的美好事物,被鱼龙混杂的信息误导、被不切实际的想象捧杀,对它的发展有害无益。 声纹识别是一项简单、优雅、安全的技术。我们希望这个朝气蓬勃的产业 从一开始,就走上一条良性健康发展的道路,在开启新希望的同时,避免重蹈某些产业的覆辙,这就是我们为什么发布白皮书的初衷。 这份报告名为白皮书,实际上是从技术、产业、场景、企业、政策、资本 等层面,根据可获得的一些公开资料,对声纹识别学术研究和产业发展脉络微了一份梳理,力求为广大研究人员、工程师、创业者、投资商和媒体人们提供一份快速了解行业概貌的“导览地图”。 们力求尽量客就的反映这一新生行业的总体态势,但还读不上多么全面 和深入,里面提到的有些欢点,也可能有不对或不要之处,需要交给市场和时 间去检验。 感谢AIIA对发布这份报告给予的支持。初试筛声,难免挂一漏万,还请业界朋友和广大读者多包涵,多指正。 是为序。 郑方 清华大学人工智能研究院听觉智能研究中心主任 得意普迪信息技术研究院院长 目录 声纹识别发展背景和环境分析 1.1. 移动万物互联,生物特征识别迅速抢占市场。 1.2.人脸指纹漏洞频发,个人隐私泄露风险加剧 1.3.系列政策法规出台,国家加快AI产业引导, 1.4.生物识别从生理特征走向行为特征, 1.5.语音交互从千人一面向个性化进阶 2.声纹识别技术发展现状, 2.1, 声纹是一种特殊的行为特征。 2.2. 声纹识别技术的分类逻辑 2.3. 声纹识别技术进入商用 9 2.4. 行业专利申请量激增, 11 3. 声纹识别产业发展现状 13 3.1. 市场规模:想象空间巨大,规模将超千亿 13 3.2. 竞争格局:赛道选手增加,专业厂商领跑, 13 3.3. 市场份额:外企入华分美,中企绝对占优 13 3.4. 技术来源:技术门橙高企,来源高度集中 14 3.5. 资本现状:融资进度提速,行业风口可期 15 3.6. 公司案例:得意音通 16 4. 主要应用领域及场景 17 4.1. 国家公共安全 4.2. 泛金融. 18 4.3. 社会保险, 18 4.4. 智能安防及个性化语音交互 19 4.5. 典型应用案例:金融领域 19 4.5.1. 4.5.2. 中国建设银行.19 贵阳银行24 4.5.3,西安银行 4.5.4.浦东发展银行25 5.标准化建设27 5.1.技术基础标准化27 5.2.金融应用标准化29 5.3.正在进行的标准化.30 6.技术挑战与发展趋势32 6.1.技术挑战。,32 6.2.发展趋势。35 附一:图表索引.37 附二:参考文献,38 1.声纹识别发展背景和环境分析 1.1.移动方物互联,生物特征识别迅速抢占市场 据2019年中国互联网络信息中心发布的中国互联网络发展状况统计报告》 显示,截至2018年12月,中国网民的规模达到了8.29亿,全年新增网民的数量是5653万,互联网的普及率是59.6%,较前年底提升了3.8个百分点;中国手机网民的规模达到了8.17亿,全年新增手机网民的数量是6433万。截止去年12月,我国即时通信用户规模达7.92亿,网络新闻用户规模达6.75亿,网络购物用户规模达6.10亿,网上外卖用户规模达4.06亿,网络支付用户规模达6.00亿, 网络视频用户规模达6.12亿,短视频用户规模达6.48亿。 以争机为中心的智能设备,成为“方物互联”的基础。移动支付、车联网、智 能家居、智能安防等智能化应用场景多方位促进国人“衣食住行"体验升级。移动互联网服务场景不断丰富,应用场景日趋复杂,网络身份认证作为防护网络资产的第一道关口,在万物联网时代有着举足轻重的作用, 生物识别技术作为新一代人工智能的重要领域,借助人体生理特征或行为特征进行身份识别。近年来得益于云计算、大数据、物联网、深度学习等信息技术的快速发展,生物识别技术在基础理论、算法模型、创新应用、软件支持等方面 不断取得突破。 研与投资预测分析报告》显示,2013年全球生物识别市场的规模达到98亿美元。2016年生物识别技术行业的市场规模在150亿美元左右,到2021年这一数值将增加至305亿美元。2002至2015年,国内生物识别市场的年复合增长率达到 50%,2016年生物识别市场规模达到120亿元左右。预计到2021年,中国生物识别行业的市场规模将突破340亿元人民币。 350 300 CAGR-15.5% 200 189.9 150 100 50 全球生特识财就术行业市场规模(亿美元) 图表1-12007一2021年全球生物识别技术行业市场规模与预测 图表来源:前瞻产业研究院 400 350 300 250CAGR=23.2% 200 150120 100 50 00.83.5 2002年2006年2012年2018年2021年 中国生物识联术行业市场线模(亿元) 图表1-22002一2021年中国生物识别技术行业市场规模与预测 图表来源:前瞻产业研究院 1.2.人脸指纹漏洞频发,个人隐私泄露风险加剧 人险识别安全漏洞在2017年的“3·15”晚会上首次噪光,凭借一张观众的 自拍照成功“换脸”破解手机人脸识别系统。 >假体攻击相关的安全漏洞:无效的活体检测 雷锋网:盗刷28万,某支付平台“人脸识别"现重大漏洞 https:/www.leiphone.com/news/201801/UfmGiSEhFiSVWBXo.html 》无意图检测带来的安全风险:“被指纹”和“被人脸” 风凰网科技:最担心的事发生了!男子睡梦中被人用手机刷脸,醒来卡里一万多元没了! http://tech.ifeng.com/a/20190407/45588746_0.shtml 半岛都市报:女子网上交友被坑、熟睡中手机被男友盗制20万 http:/news.banda0.cn/newshtml/201807/20180703/news_20180703_2842126.s html 比起数据在传输和认证过程中的安全漏洞,后台的生物特征数据一且被盗, 大量最带有唯一性的生物特征数据被盗取,给用户带来的风险将会更大。 中国支付清算协会2018年移动支付用户调研报告显示,“个人信息泄露是用户使用移动支付过程中最常遇到的安全问题”。在移动支付用户实际使用行为分析中,“个人信息被泄露”高居第一,占比高达81.0%,高于第二位的“手机扫描 到伪假条码”70.1% 开通管锁 离户不文持 文付失败变付环节操作复杂存在安全隐思 个人隐私泄露 0.0%10.0%20.0%30.0%40.0%50.0%60.0%70.0%80.0% 图表1-3移动支付用户对生物特征识别技术认知程度分析 数据来源:《2018年移动支付用户调研报告》 1.3.系列政策法规出台,国家加快AI产业引导 2017年6月,《中华人民共和国网络安全法》正式施行,提出实施网络可信身份战略,支持研究开发安全、方便的电子身份认证技术,推动不同电子身份认证之间的互认;明确将个人生物识别信息纳入个人信息范畴进行规范管理。 2017年7月,国务院印发《新一代人工智能发展规划",从建立关键共性技术体系、探索行业创新应用等方面对生物识别技术发展提出了重点任务。 2017年12月,工信部印发促进新一代人工智能产业发展三年行动计划 (2018-2020年)》,智能身份识别系统、智能语音交互系统同时被列入率先取得 突破的8大重点领域。2018年9月,第十三届全国人大常委会将《个人信息保护法》列入本届立 3 法规划。人工智能和大数据时代的个人信息保护即将迎来专门立法。 1.4.生物识别从生理特征走向行为特征 生物特征识别最大的共性是唯一性。人的生理特征都存在唯一性,每个人都有独一无二的脸、指纹、虹膜等。由于每个人的生物特征具有与其他人不同的唯一性和在一定时期内不变的稳定性,所以利用生物识别技术进行身份认定相对其他身份认证技术是安全且准确的。但也正是由于生理特征的不可撤销性,生物特征信息一且被泄露、大量的带有唯一性的生物特征数据被盗取,基于生理特征的身份识别系统将彻底前溃,这也是生理特征识别方式的真正“痛点”。 要素类别 知悉持有生理风险分析 远程身份金融领域安全 认证技术场景示例等级 要素要素要素 手机号码+短信验证码手机银行找回密码手机恶意软件窃取验证码低 银行卡卡面信息+银行预留信息+ 非银行支付机构利用银行卡卡面信息、交易密 较高 银行卡绑定进行实名 交易密码+ 短信验证码 认证 非银行支付机构利用 码、手机短信验证码泄露 身份证照片+人脸照片手持身份证照片进行照片被窃取或伪造较高 实名认证 指纹、人脸、虹膜等手机银行登录、移动生物认证技术支付 生物特征泄露、假体攻击较高 高 身份证号+姓名+人脸ⅡI、川类账户远程开身份证卡面信息泄露且人 照片户脸照片被伪造 数字证书+PINy网银专业版登陆数体丢失且PIN泄露高 声纹识别技术手机银行登录、移动 (声纹+动态声纹密码)支付 生物特征泄露、重放攻击高 图表1-4移动金融中远程身份认证技术安全性比较 资料来源:中国人民银行移动金融基于声纹识别的安全应用技术规范》标准编制组 1.5.语音交互从千人一面向个性化进阶 2017可以看做智能语音交互元年,各品牌厂商打造的智能音箱纷纷上市。 2018年语音交互落地突然加速,产品从智能音箱扩展到其他品类,如电视盒子、闹钟、灯、智能马桶等。未来,语音交互将迎来更多成长机会和更大的发展空间。在由全球最大中文IT社区CSDN组织编撰的《2018中国人工智能产业路线图》 中,将语音交互划分为三种阶段: >L1阶段:能以极高的准确率,在典型环境下响应用户的语音输入: >L2阶段:能以极高的准确率识别出交互的当事人和环境,然后进行个性化的 交互; 》L3阶段:只要有数据,语音交互系统的能力就可以无边界扩展(包括个性和 能力)。 在L2阶段体现的是个性化,语音交互不再停留在千人一面的固定化模式中,而是实现千人千面的个性化交互体验。 注:以上段落援引自声智科技李智勇语音交互的进阶之路:层级、技术与 赖覆性》 2.声纹识别技术发展现状 2.1.声纹是一种特殊的行为特征 声纹,是对语音申所蕴含的、能表征和标识说人的语音特征,以及基于 这些特征(参数)所建立的语音模型的总称,而声纹识别是根据待识别语音的声纹特征识别该段语音所对应的说话人的过程。与指纹类似,每个人在说话过程中所蕴含的语音特征和发音习惯几乎是独一无二的,即使是模仿,也难以改 变说话者最本质的发音特性和声道特征。由于声音的特殊性,声纹识别与其他 行为特征相比,又兼具生理特性。 声纹识别和语音识别在原理上一样,都是通过对采集到