2022中国隐私计算产业研究报告 亿欧智库https://www.iyiou.com/researchCopyrightreservedtoEqualOceanIntelligence,October2022 目录 CONTENTS 1.隐私计算产业发展现状分析 2.隐私计算产业发展趋势分析 3.隐私计算典型应用场景分析 4.隐私计算产业发展机遇与挑战 发展环境 在数据上升为与土地、劳动力、资本、技术并列的生产要素的大背景下,多项政策提出要加快培育数 据要素市场。隐私计算可帮助推进政府数据开放共享,研究建立公共数据开放和数据资源有效流动。 产业趋势 隐私计算场景应用实践的加深将会在不同程度上同频带动算力加速需求的增加,算力加速将成为重要 竞争力;隐私计算未来生态主要由数据源、数据使用方和服务商参与,开源产品已成为生态中的主流。 应用现状 目前市场上隐私计算应用最多的领域主要为金融、政务和医疗,其中应用最成熟的是银行业、保险业, 隐私计算在资管行业发展相对较慢,政府与医疗场景具有极大发展潜力。 机遇挑战 隐私计算产品目前会造成用户对性能与安全性二选一的抉择,并且隐私计算产品在算法协议、开发应 用方面安全性仍有不足,一体机成为目前落地最为广泛的软硬一体解决方案。 RSA:一般指RSA算法,一种使用不同的加密密钥与解密密钥,“由已知加密密钥推导出解密密钥在计算上是不可行的”密码体制 同态加密:基于数学难题的计算复杂性理论的密码学技术;对经过同态加密的数据进行处理得到一个输出,将这一输出进行解密,其结果与用同一方法处理未加密的原始数据得到的输出结果是一样的 TEE:TrustedExecutionEnvironment,可信执行环境,通过软硬件方法在中央处理器中构建一个安全区域,保证其内部加载的程序和数据在 机密性和完整性上得到保护 联邦学习:一种分布式机器学习技术,其核心思想是通过在多个拥有本地数据的数据源之间进行分布式模型训练,在不需要交换本地个体或样本数据的前提下,仅通过交换模型参数或中间结果的方式,构建基于虚拟融合数据下的全局模型,从而实现数据隐私保护和数据共享计算的平衡 GPU:GraphicsProcessingUnit,图形处理器,是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上做图像和图形相关运算工作的微处理器 FPGA:FieldProgrammableGateArray,现场可编程门阵列,作为专用集成电路领域中的一种半定制电路而出现的,既解决了定制电路的不 足,又克服了原有可编程器件门电路数有限的缺点 一、隐私计算产业发展现状分析 概念界定:保证提供方不泄露原始数据,对数据分析计算的一系列信息技术 2016年4月,通信学报上刊登的《隐私计算研究范畴及发展趋势》将隐私计算定义为是面向隐私信息全生命周期保护的计算理论和方法,是隐私信息的所有权、管理权和使用权分离时隐私度量、隐私泄漏代价、隐私保护与隐私分析复杂性的可计算模型与公理化系统。 2019年,《隐私计算——概念、计算框架及其未来发展趋势》一文将隐私计算定义为是面向隐私信息全生命周期保护的计算理论和方法,具体是指在处理视频、音频、图像、图形、文字、数值、泛在网络行为信息流等信息时,对所涉及的隐私信息进行描述、度量、评价和融合等操作,形成一套符号化、公式化且具有量化评价标准的隐私计算理论、算法及应用技术,支持多系统融合的隐私信息保护。 2021年,中国信息通信研究院云计算与大数据研究所在《隐私计算法律与合规研究白皮书》中将隐私计算定义为在保证数据提供方不泄露原始数据的前提下,对数据进行分析计算的一系列信息技术,实现数据在流通与融合过程中的“可用不可见”。 亿欧智库:隐私计算的特征 输入隐私 输出隐私 数据拥有方数据计算方数据使用方 一般的隐私计算应用中,通常至少有两个参与方,部分参与方可承担两个或两个以上的角色。 数据计算方需保证输入隐私:参与方不能在非授权状态下获取或者解析出原始数据及中间计算结果。 数据计算方需保证输出隐私:参与方不能从输出结果中反推出敏感信息。 隐私计算特征 面对数据计算的参与方或其他意图窃取信息的攻击者,隐私保护计算技术能够实现数据处于加密状态或不透明状态下的计算,以达到各参与方隐私保护的目的。隐私计算是一套包含人工智能、密码学、数据科学等众多领域交叉融合的跨学科技术体系。它能够保证满足数据隐私安全的基础上,实现数据“价值”的流通与共享,真正做到“数据可用不可见”。 服务器 计算模块 机构1 机构2 机构3 差分隐私 可信执行环境 数据 数据 数据 机构间有互信基础 数据 计算 模块 数据 计算 模块 数据 计算 模块 计算 计算 计算 联邦学习拆分学习差分隐私 多方安全计算 同态加密 机构间无互信基础 场景 技术路径 基于隐私保护计算的“跨机构”数据协同模式 特征 •数据参与方将数据汇总,统一进行模型的训练 •能够实现高性能大规模的计算 •难点在于可信环境的构建,对于信任关系要求高,需要通过政府监管、加密硬件等方式构建 •所有模型训练计算都是分布式的 •安全性得到保障 •模型规模和复杂性的限制较多 •介于集中式和分布式之间 •每一方都会参与计算,同时存在一个中间计算层 •代表技术是联邦学习 计算架构 服务器 计算模块 数据 模块 数据 模块 数据 模块 机构1 机构2 机构3 集中式模式去中心化式模式 联合计算模式 K匿名 L多样性 T接近 去标识 泛化 加密 随机化 扰动 差分隐私 为了实现数据“可用不可见、可用不可存、可控可计量”的安全流通,数据安全流通技术体系由数据生成及采集、数据传输、数据存储、数据使用(共享交易)、数据溯源与审计五个环节组成。 其中,隐私计算是指数据使用环节中所使用的隐私保护的数据计算技术。 脱敏技术 匿名化技术 数据失真技术 分布式数据传输协议 数字指纹 区块链 信息隐藏技术 可视密码 隐匿协议 潜信道 传输层安全协议 蜂蜜加密 模糊加密 代理重加密 零知识证明 差分隐私 同态加密 加密经济学技术 合约计算 可搜索加密 可验证计算 隐私计算 可信执行环境 联邦学习 安全多方计算 区块链 数字指纹 数字签名 数字水印 亿欧智库:隐私计算在数据安全流通中的定位和环节 数据安全流通技术体系 数据生成及采集 数据传输 数据存储 数据使用(共享交易) 数据溯源与审计 数据沙箱 细粒度访问控制 区块链 数据授权控制与存证 目前,国内的隐私计算业界将隐私计算相关技术概括为三个大类,分别为以安全多方计算为代表的密码学路径、以可信任执行环境为代表的硬件路径和以联邦学习为代表的人工智能路径。 密码学路径——安全多方计算\同态加密 1978年随着非对称式加密算法RSA的出现,同态加密的概念被首次提出。 -RivestR,etal.OnDataBanksandPrivacyHomomorphisms.1978 1982年姚期智教授提出了百万富翁问题,引入了安全两方计算。1987年由GMW拓展到安全多方计算。 -YaoAC.Protocolsforsecurecomputations.1982 2017年,国际同态加密委员会成立,标志着同台加密在全球进入高速发展阶段。 -ApplicationofHomomorphicEncryptionStandard.2017 2019年,由阿里巴巴牵头的MPC联盟成立,并开始推进相关IEEE国际标准,标志着MPC进入商业发展阶段。 -MPCAlliance 硬件路径——可信执行环境 2009年OMTP提出了TEE标准。2015年Intel发布首款支持TEE方案的CPU,IntelSGX. -OMTP.AdvancedTrustedEnvironment:OMTPTR1. 2009 2016年王爽教授团队完成了基于TEE和安全联邦学习的全球首例支持跨多个国家的罕见病跨国医疗数据隐私保护下的互联互通,并获得Intel杰出贡献奖。 -Bioinformatics,vol.33,no.6,p871 2018年百度发布MesaTEE解决方案。 2020年阿里巴巴发布OcclumTEE系统,可信计算环境进入高速商用发展阶段。 -Mesa开源:隐私保护的高性能通用安全计算终成现实-百度 安全社区,2021 人工智能路径——联邦学习 2012年王爽教授团队发表了全球首篇医学在线安全联邦学习文件,提出了“数据可用不可见”的问题和解决隐私计算的基础性框架和联邦学习的工程落地方案 -“EXPLORER”,Blomed,Inform,2013 2016年Google提出了联邦学习在移动互联网上应用的概念,隐私计算技术被认可并进入快速发展阶段。 -JKonecyetal,“FL:StrategiesforImproving CommunicationEfficient”ArXiv,2016 2018年杨强教授团队携手腾讯/微众银行,用联邦学习技术发布了开源项目FATE。 隐私计算政策历程:充分发挥数据要素价值,安全可控驱动隐私计算发展 作为数字经济时代的新型生产要素,数据的价值日益被充分认可。2020年,国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》,将数据上升为与土地、劳动力、资本、技术并列的生产要素,提出要加快培育数据要素市场。推进政府数据开放共享,研究建立公共数据开放和数据资源有效流动的制度规范。 国家《“十四五”数字经济发展规划》也明确提出要充分发挥数据要素作用、强化高质量数据要素供给,加快数据要素市场化流通,创新数据要素开发利用机制;加快构建数据要素市场规则,培育市场主体、完善治理体系,到2025年初步建立数据要素市场体系。这标志着我国数字经济发展转向以“数据要素市场”为核心的普惠共享、深化应用的新阶段。 亿欧智库:我国数据战略布局历程 酝酿阶段 落地阶段 深化阶段 重视数据价值 数据要素市场化配置上升为国家战略 大数据首次写入政府工作报告 大数据连续六年写入政府工作报告 十九大报告提出“推动大数据与实体经济融合” 《十三五》规划纲要第二十七章“实施国家大数据战略 《十四五大数据产业发展规划》发布,大数据产业高质量发展成为主题 “大数据”成为热点 促进数据应用 实施国家大数据战略 明确数据要素地位 加快数据要素市场化建设 国务院印发《促进大数据发展的行动纲要》 工信部发布《大数 据产业发展规划 (2016-2020) 十九届四中全会首次公开提出“数据可作为生产要素按贡献参与分配” 《关于新时代加快完善社会主义市场经济体制的意见》提出“加快培育发展数据要素市场” 中国大数据政策元年 大数据上升国家战略 中央政治局就实施国家大数据战略进行集体学习 《关于构建更加完善的要素市场化配置体制机制的意见》数据被正式列为新型生产要素 十四五规划正式发布,大数据发展已经融入各篇章中 2014.32015.82016.32016.122017.102017.122019.32019.102020.42020.52021.32021.11 资本市场:隐私计算投融资热度逐年上升 风口之上,“追风者”蜂拥而至。互联网巨头、网络安全、大数据公司、初创型科技企业及行业数据高度聚合型企业纷纷入局。根据国家工业信息安全发展研究中心发布的《中国隐私计算产业发展报告(2020-2021)》显示,2021年隐私计算产品市场规模约为10亿元,基于隐私计算的数据交易应用模式市场或将达到千亿级。 从2016年至2022年上半年,隐私计算初创公司累计获得57笔股权融资,公开披露的融资总额达到56.1亿元(12笔未透露金额),笔均融资多在千万级规模。其中2020年与2021年热度较高,就2022年上半年表现来看,热度仍在持