隐私计算白皮书 (2022年) 隐私计算联盟 2022年12月 版权声明 本报告版权属于隐私计算联盟、中国信息通信研究院云计算 与大数据研究所,并受法律保护。转载、摘编或利用其它方式使用本报告文字或者观点的,应注明“来源:隐私计算联盟、中国信息通信研究院云计算与大数据研究所”。违反上述声明者,本院将追究其相关法律责任。 编写委员会 ❖主要编写单位(排名不分先后): 隐私计算联盟、京东科技信息技术股份有限公司、北京数牍科技有限公司、蚂蚁科技集团股份有限公司、蚂蚁区块链科技(上海)有限公司、上海富数科技有限公司、上海浦东发展银行股份有限公司、洞见智慧科技有限公司、同盾科技有限公司 ❖参与编写单位(排名不分先后): 优刻得科技股份有限公司、阿里巴巴(中国)有限公司、北京八分量信息科技有限公司、杭州安恒信息技术股份有限公司、杭州卷积云科技有限公司、西安交通大学、杭州趣链科技有限公司、浙江吉利数字科技有限公司、杭州金智塔科技有限公司、北京百度网讯科技有限公司、京信数据科技有限公司、联通数字科技有限公司、杭州锘崴信息科技有限公司、上海零数科技有限公司、腾讯云计算(北京)有限责任公司、天冕信息技术(深圳)有限公司、深圳前海微众银行股份有限公司、星环信息科技(上海)股份有限公司、深圳致星科技有限公司、翼健(上海)信息科技有限公司、北京冲量在线科技有限公司、交通银行股份有限公司、中国移动通信有限公司研究院、中兴通讯股份有限公司、中国工商银行软件开发中心 ❖编写组主要成员(排名不分先后): 贾轩 闫树 袁博 王思源 杨靖世 王丹阳 童锦瑞 宋佳楠 魏凯 姜春宇 白玉真 吕艾临 刘嘉夕 马智华 杨博 孙中伟 金银玉 单进勇 李宏宇 张晓蒙 昌文婷 彭晋 卞阳 杨天雅 周骏 冯云青 陶建萍 李博 袁志烨 李绍宾 黄翠婷 陈涛 潘榕 刘沛 金朵 王铀之 何志坚 任雪斌 杨树森 徐静 李晨龙 吴凯 薛勇 陈超超 周吉文 于欢 汤克云 崔玲龙 王帅 兰春嘉 李克鹏 吴焕明 葛娴 唐恺 苗天麒 马轩 王光中 周边 李崇 郭海生 黄司辉 前言 我国高度重视数据安全流通技术的发展应用,过去一年内多个部门密集出台了一系列战略、规划和政策,强调数据要素流通的重要性,提出数据安全流通的建设方案。2022年1月国务院办公厅印发的《要素市场化配置综合改革试点总体方案》中提出,探索“原始数据不出域、数据可用不可见”的交易范式。12月19日,中共中央、国务院发布的《关于构建数据基础制度更好发挥数据要素作用的意见》提出要建立数据产权分置的产权运行机制,建立合规高效的数据要素流通和交易制度,从数据产权、流通交易、收益分配、安全治理等四项制度提出二十条政策举措,初步形成我国数据基础制度的“四梁八柱”。 隐私计算技术作为保障数据安全流通的有效方式,在政策驱动和市场需求同时作用下,乘时乘势高速发展,已逐渐成为促进数据要素跨域流通和应用的核心技术,广泛应用于金融、政务、医疗、能源、制造等诸多领域。 2021年,中国信通院云大所联合隐私计算联盟发布《隐私计算白皮书(2021年)》,全面展示了隐私计算发展状况。经过一年多的发展,隐私计算在政策、技术、应用等方面上均迎来了新的进展。 《隐私计算白皮书(2022年)》将全面展现行业成就及发展新态势,希望为产业界应用隐私计算技术提供参考指导,推动隐私计算行业健康发展,让隐私计算在数据要素市场建设过程中发挥更大的价值。 本研究报告亮点如下: 纵览发展历程,明确当前进展 根据隐私计算技术出现、发展、落地到广泛应用的不同特点,梳理隐私计算发展阶段,明确当下发展阶段并研判未来发展前景。 把握技术前沿,洞察发展趋势 作为数据安全流通的关键技术,隐私计算技术向推动应用落地的方向持续发展,可用性和可信性进一步增强。通过对技术发展的前沿进行整理和分析,洞察隐私计算技术发展趋势,为落地应用搭建桥梁。 聚焦应用实际,凸显应用优势 在广泛调研的基础上全面梳理隐私计算在实际数据流通中的最新应用情况,深度剖析隐私计算发挥巨大价值的内在逻辑,更加清晰地回答“隐私计算与传统数据流通技术相比有何优势”“哪些特定创新场景只有隐私计算能够解决”等问题,进一步明确隐私计算优势,促进隐私计算应用发展。 综述行业现状,梳理发展热点 通过对隐私计算商业模式、市场规模、科研、开源、互联互通等行业情况进行综述及分析,梳理隐私计算安全性、性能、互联互通、合规性等发展热点,把握行业整体脉络,为战略布局提供参考。 道阻且长,行则将至;行而不辍,未来可期。面对这个日新月异、快速发展的行业,我们期待与业界共同守正创新,推动隐私计算行业健康发展,让隐私计算在数据要素市场建设和数据流通过程中发挥更大的价值,踔厉奋发谱写隐私计算新篇章! 目录 一、隐私计算概述1 (一)隐私计算在政策和需求驱动下快速发展1 (二)隐私计算正处于产业增长期阶段2 二、技术分析5 (一)多方安全计算可用性进一步提升5 (二)联邦学习技术进入快速发展阶段7 (三)可信执行环境软硬件均迎来突破8 (四)多技术融合,优势互补助力突破应用瓶颈10 (五)概念外延,广义隐私计算技术体系形成12 三、应用分析13 (一)存量优化,隐私计算提升传统场景安全14 (二)增量创新,隐私计算满足新兴场景需求18 四、行业分析23 (一)隐私计算供需双方共建产业生态23 (二)隐私计算未来市场整体前景广阔25 (三)隐私计算领域科研成果快速增长27 (四)开源促进隐私计算行业蓬勃发展33 五、发展热点问题分析36 (一)隐私计算安全性分析36 (二)隐私计算性能分析39 (三)隐私计算互联互通分析41 (四)隐私计算合规性分析43 六、总结与展望46 附录49 参考文献53 图目录 图1隐私计算四个发展阶段3 图2广义隐私计算技术体系12 图3隐私计算应用覆盖场景示意图14 图4隐私计算存量优化应用场景通用解决方案模型15 图5隐私计算增量创新应用场景通用解决方案模型19 图6隐私计算不暴露明文ID解决方案模型19 图7近五年隐私计算科研成果(论文、专利、软著)统计31 图8各国隐私计算领域论文发表数量(Top10)(2018-2022)31 图9隐私计算研究论文近五年发展趋势(2018-2022)32 图10隐私计算海内外专利近五年发展趋势(2018-2022)33 图11隐私计算国内软著近五年发展趋势(2018-2022)33 表目录 表1三大主流技术路线整体描述及分析10 表2我国隐私计算市场规模的相关测算结果25 表3隐私计算国际相关标准情况28 表4隐私计算国内相关标准情况29 表5目前国内外主要的隐私计算开源项目35 一、隐私计算概述 (一)隐私计算在政策和需求驱动下快速发展 自2019年党的十九届四中全会首次将数据列为生产要素,高速发展的数字经济已经成为带动中国经济增长的核心动力之一。我国数字经济规模由2017年的27.2万亿元增至2021年的45.5万亿元,总量稳居世界第二,年均复合增长率达13.6%。然而,数据要素本身往往含有敏感信息,面临着流通后的数据滥用、信息泄漏和信息可被反推等隐私安全风险,因此数据安全流通开始引发广泛关注。 在政策布局上,我国高度重视数据安全流通的发展应用,过去一年内多个部门密集出台了一系列战略、规划和政策,强调数据要素流通的重要性,提出数据安全流通的发展规划。2022年1月国务院发布的《“十四五”数字经济发展规划》中提出加快构建数据要素市场规则,促进数据要素市场流通。同月,国务院办公厅印发的《要素市场化配置综合改革试点总体方案》中提出,探索“原始数据不出域、数据可用不可见”的交易范式,探索建立数据用途和用量控制制度,实现数据使用“可控可计量”。今年4月,《中共中央国务院关于加快建设全国统一大市场的意见》提出加快培育数据要素市场,建立健全数据安全、权利保护、跨境传输管理、交易流通、开放共享、安全认证等基础制度和标准规范,深入开展数据资源调查,推动数据资源开发利用。12月19日,中共中央、国务院发布的《关于构建数据基础制度更好发挥数据要素作用的意见》提出要建立数据产权分置的产权运行机制,建立合规高效的数据要素流通和交易制度,从数据产权、 流通交易、收益分配、安全治理等四项制度提出二十条政策举措,初步形成我国数据基础制度的“四梁八柱”。 隐私计算技术作为保障数据安全流通的有效方式,乘时乘势高速发展,已逐渐成为促进数据要素跨域流通和应用的核心技术,广泛应用于金融、政务、医疗、能源、制造等诸多领域。2020年4月,《工业和信息化部关于工业大数据发展的指导意见》提出,激发工业数据市场活力,支持开展数据流动关键技术攻关,建设可信的工业数据流通环境。2021年5月印发的《全国一体化大数据中心协同创新体系算力枢纽实施方案》提出,促进数据有序流通,试验多方安全计算、区块链、隐私计算、数据沙箱等技术模式,构建数据可信流通环境,提高数据流通效率。2022年10月国务院办公厅印发的《全国一体化政务大数据体系建设指南》提出探索利用核查、模型分析、隐私计算等多种手段,有效支撑地方数据资源深度开发利用。 对隐私计算产业来说,在政策利好的持续推动下,行业市场发展与技术不断更新,技术体系不断完善,行业标准日趋统一,应用场景逐渐丰富,隐私计算产业将持续面临着良好的发展环境。 (二)隐私计算正处于产业增长期阶段 隐私计算技术可以追溯到1949年由香农开启的现代密码学时代,之后其内涵、特征及代表技术不断演进,融合了密码学、人工智能、计算机科学以及安全硬件等众多领域技术。直到2001年,国外正式提出“隐私增强技术”(PrivacyEnhancingTechnologies,PETs)的概念。国内也于2016年的《隐私计算研究范畴及发展趋势》中正式提 出“隐私计算”一词。 根据隐私计算技术出现、发展、落地到广泛应用的不同特点,我们将隐私计算的发展历程划分为四个阶段(如图1): 图1隐私计算四个发展阶段 萌芽期(1949年-1981年):需求出现,概念萌芽。起始于20世纪40年代,现代信息学之父克劳德·香农的一篇重要论文《保密系统的通信理论》,被认为是现代密码学时代的开端。 探索期(1982年-2016年):主流技术路线出现。随着多方安全计算、联邦学习、可信执行环境等隐私计算技术的出现和发展,隐私计算的技术栈日趋成熟。 增长期(2017年-2025年):多行业的需求方和厂商陆续加入,专利、论文、标准、政策、实施案例相继涌现。该时期各国政府逐渐加强对数据安全和个人隐私保护的重视,各项政策法规陆续制定,基于隐私计算技术的数据流通产品得到不断探索应用和落地实施。 稳定期(2025年~):未来,随着政策和法律的清晰明确,技术进一步成熟,隐私计算作为“数据流通基础设施”将被大众广泛接受。随着“隐私计算+”发展,行业应用稳步推进,更多大型企业开始全面使用隐私计算技术,应用规模稳定增长。 当前,隐私计算仍处于产业快速增长期,即将迈入前景广阔的稳定期。随着国家数据要素市场的加速建设,隐私计算技术将在更多场景得到广泛应用,“原始数据不出域,数据可用不可见”将成为多数行业数据流通的交易范式。除了实现“数据可用不可见”外,未来还需要进一步对数据的用途和用量进行控制和审计,真正实现数据使用的“可控可计量”,最大限度的保障数据要素流动过程中数据提供方的合法权益。此外,在工业界,随着国内外政策法规的不断完善,再加上对于某些数据高敏感行业强监管的需求,数据规模不断扩大,直接在中心服务器上计算或学习的压力会不断增加,从中心化向分布式或去中心化过渡的演化也将成为未来趋势。根据《Gartner2022隐私技术成熟度曲线》研究报告表明:预计在未来5~10年内,隐私计算 技术会被大规模商业化应用。预计到2025年,60%以上的大型组织将在数据分析、商业智能或云计算中使用一种或多种隐私计算技术。 二、技术分析 隐私计算(Privacy-preservingcomputation)是