您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[量子位]:隐私计算产业展望报告 - 发现报告
当前位置:首页/行业研究/报告详情/

隐私计算产业展望报告

信息技术2024-02-09-量子位D***
隐私计算产业展望报告

量子位硬科技深度产业报告——隐私计算 Privacycomputing 隐私计算 QbitaiIndustryInsight 产业展望报告 技术分析·价值延展·产业透视 1 量子位硬科技深度产业报告——隐私计算 核心结论 我们认为,隐私计算的想象空间不止于数据安全合规。作为目前能有效解决数据安全流通问题的唯一技术手段,隐私计算能够在业务价值提升、乃至社会生产力提高上有明显的放大作用。隐私计算不仅是一种工具,也不仅是作为IT底层的“隐私计算Inside”,而应当是联通价值网络的“隐私计算allover”。 同时,我们也发现,隐私计算产业,虽然仍在早期的孵化落地阶段,但已呈现出了种种“竞争过热”的现象。以下为本篇报告中,所提出与市场不同的分析结论: 1.隐私计算的价值分为三层,目前的价值来源于第一层的安全合规,但我们认为,其与AI/大数据产业的联动嵌入会成为其第二波增长动力。在未来,基于对数据要求安全流动,从而创造业务价值的影响,隐私计算将成为IT行业普遍应用的底层技术。 •行业本身的价值创造(数据合规;提升业务价值) •作为底层支撑,与AI产业及大数据产业协同发展 •推动数据要素安全流通,提升社会生产力。第三层价值回答了为何政策对隐私计算产业提供了高度支撑,也展示了这一技术目前的不可替代性,以及未来的巨大发展空间 行业自身发展 保护数据安全合规 产业协同发展推动数据要素流通,提升社会生产力 大数据&AI产业以提供数据运营,辅助数据定价确权等方式,服工具底层设施务于不同机构及交易所,推动数据要素顺利流通, 指导社会要素分配 2.据量子位智库测算,预计到2030年,我国隐私计算行业的总市场规模将达到1134亿。其中,第一、二、三层价值分别占比11%,27%和62%。 3.业界公认,隐私计算行业已经进入了“竞争过热”状态,产品供给远超意向客户及所需项目数量。玩家呈现出第三方初创公司、大型互联网公司、AI等软件开发商、转型公司、甲方自研参与的多方混战局面。尽管规划上已经有明显区分,但受限于资源和发展年限等,在具体落地上,企业的竞争战略和现有定位仍然较为同质化。我们预计未来3-5年内,将出现比较明显的差异化竞争路线。 量子位硬科技深度产业报告——隐私计算 3.隐私计算行业还处于早期落地阶段,目前整体上处于产业点状落地期(2021-2025年),行业重点在于打磨头部客户及案例实践,预计2025年后可达到大规模商用的二次浪潮。 4.行业入门门槛低、缺乏战略性的竞争差异、技术优势难以形成并证明是目前竞争过热的底层原因。扩展在产业链上的定位是玩家们未来的备选项之一。本报告基于分析给出了隐私计算产业未来的延展形态。 现有三段式产业链 隐私计算理想产业链 5.产品标准化平台化和基于数据运营的业务价值化成为竞争与发展的共同方向。 6.不同的分化路线已出现,但仍需进一步特色巩固,形成各公司可靠的战略优势,具体包含:数据生态服务商、软件系统服务商、专注垂直赛道、标准化完整方案、基础设施服务商、底层加速硬件厂商。其中,数据生态服务商已经成为绝大多数厂商的定位主张,但据观察,除专注特定赛道的厂商外,大规模的数据生态搭建仍需一段时间。 7.要实现破局,需要强调的是隐私计算行业的综合门槛。主要涉及标杆客户、长期自研技术壁垒、连接能力、价值创造能力和产品工程化能力。 本系列报告感谢以下公司参与深度采访:冲量在线、洞见科技、锘崴科技、融数联智、华控清交、微众银行、富数科技、平安科技、星云Clustar、同盾科技、翼方建数、矩阵元、OpenMPC(排名不分先后) 量子位硬科技深度产业报告——隐私计算 目录 技术篇 01定义及分类 02技术发展现状 价值篇 04技术价值分析 07市场价值估算 产业篇 09行业供需现状—供远大于需,现有行业天花板明显 11代表玩家分析—多方参与,现有落地路线相似,有待进一步分化 17行业阶段划分—仍需3年进入成熟阶段 21产业链分析—需从数据要素角度出发延展产业链定位 24竞争过热背后—同质化导致缺乏竞争壁垒 25未来破局—关注行业综合门槛 技术篇 1.1定义 隐私计算并非特定的技术,而是近年提出的新技术概念,统指用于保护原始数据隐私的软硬件技术。在使用隐私计算后,使用者能够在不泄露原始数据、保护数据拥有者隐私及利益的前提下(如客户的具体身份),对所需数据进行采集加工、 处理分析等。也即业界常称的“数据可用不可见”。 除去自有的“数据可用不可见”特性外,在辅以MPC、区块链等技术后,隐私计算还能够实现数据的“用途可控可计量”,并完善定价、确权等功能。在数据要素市场上,从底层的隐私保护出发,承接转移、交易、定价、确权等流程的技术需求。 目前多实现的典型功能包括: •隐私检索匹配:保护检索过程中的检索条件,在条件加密的情况下和数据库进行匹配 •隐私推理:在保护个体信息的前提下,直接得到模型结果 •隐私建模:连接多个机构的横向建模,这一功能在病人样本稀缺的医学领域表现突出 三大技术路线 在技术路线上,隐私计算大致可以分为联邦学习、多方安全计算和可信硬件三类。 在实际应用中,不同的场景、模型关注的技术指标不同(如安全性、准确性、并发性、响应速度等),而三类技术路线各自存在长短板,仅靠单一路线无法满足需求。因此,隐私计算公司不会将自身限定在某一特定路线上,而是选择全面布局,同时在专长的路线上形成技术壁垒。在实际应用中,基于对性能、安全性和准确性的取舍,对各类技术模块根据需求灵活部署。 代表公司* 多方安全计算 MPc(SecureMulti-Partycomputation) 在无可信第三方的前提下,通过多方共同参与,安全地完成某种协同计算。即,在一个分布式的网络中,每个参与者都各自持有处理后的秘密信息(如加密数据、模型、梯度、参数等),共同完成对某个函数的计算,没有中心节点 基于MPC的隐私计算领域应用了同态加密(HomomorpgicEncryption)、不经意传输(ObliviousTransfer)、混淆电路(GarbledCircuit),秘密共享(SecretSharing)等十分复杂的密码学技术 技术特征 严重损耗效率:由于有基于密码学的严格信任假设前提,MPC技术的安全性相对更高,但同时也会严重损耗效率(算力、 问题通信等)。因此,多方安全计算大多是在分等级(信息处理标准不同)、分场景(如多用于两方计算、高延时场景)的前提条件下,结合其他加密方式使用的 *本表格及后续表格中不同技术的代表公司参考了中国信通院云大所2021年7月《隐私计算白皮书》中公布的测评结果 联邦学习 fL(federatedlearning) 代表公司 1 技术特征 大致可分为三类* ·横向联邦学习(特征高度重合,联合的是样本。适用于业务逻辑相似的多方) ·纵向联邦学习(样本数据重合,适用于目标样本重合的多方) ·联邦迁移学习(同时结合了横纵向的两类特点) 最早由谷歌提出,用于利用用户手机进行模型训练。在进行机器学习的过程中,各参与方借助其他方数据进行联合建模,各方无需共享数据资源,本地原始数据不出库,对中间加密数据流通&处理,来完成多方联合的机器学习训练,建立共享的机器学习模型。该技术路线下仍然具有中心节点 ·模型效果提升可能相对有限,因为数据间重合,或者过于无关,或者难以获取等 问题 ·联邦学习算法基于梯度,可能被还原,其安全性有待进一步考量,一般与TEE、合成数据等其他技术联合使用,以增强安全性 *定义参考:微众银行2020年4月《联邦学习白皮书2.0》、中国信通院云大所2021年7月《隐私计算白皮书》 代表公司 可信执行环境 TEE(EntrustedExecutionEnvironment) 在硬件层面上,将各方数据统一汇聚到隔离的执行环境进行单独计算,该环境的安全性更强,功能比安全芯片更丰富,提供代码和数据的机密性和完整性保护*,具体实现效果与硬件的开发水平紧密相关。 技术特征 主流TEE技术以X86指令集架构的IntelSGX技术和ARM指令集架构的TrustZone技术为代表,支持多层次、高复杂度的算法逻辑实现,运算效率高,可信度量保证运行逻辑可信等,被广泛认可*。 由于无需学习密码学、相关统计学等,第三方的使用门槛较低,且其安全性不涉及算力问题,在国外使用更广。Linus基金会旗下设立机密计算联盟(ConfidentialComputingConsortium),早期参与者以TEE厂商为主。 目前,这一路线的争议主要在于芯片厂商,特别是国外厂商的可信度问题。为此,国产硬件与信创厂商的隐私计算适配已经成 为星云Clustar、融数联智、冲量在线等隐私计算公司新的战略增长点。 问题 此外,这一技术十分复杂,与底层硬件适配的门槛较高(据冲量在线透露,其适配代码超过200万行),部署过程复杂。因此前 期研发投入高,需要研发人员同时具有芯片设计、密码学等基础。其实际安全效果除硬件外还有赖于传输层安全协议、多因素验证、密钥管理服务等。 1.2技术发展现状 *参考中国信通院云大所2021年7月《隐私计算白皮书》 隐私计算技术相关的底层理论最早出现于上世纪80年代。密码学、零知识证明等分支技术在数据安全等领域均已有一定的商业应用,这也导致多家隐私计算初创公司脱胎于综合性厂商的相关技术部门,在技术商用落地上有一定的先发优势。 2020年起,隐私计算作为单独的技术门类,逐渐克服了安全、效率(如大量节点的并行计算、百万级数据规模)、可用方式(除加、减、比较外,开始支持逻辑函数、分类算法、甚至神经网络等)等技术门槛,进入点状落地阶段,并出现了对数据规模和延迟要求更高的生产级、城市级、基础设施级解决方案。 安全 然而,尽管隐私计算技术已经有了明显发展,但依旧有些问题需要关注。 •不可能三角 在隐私计算中,由于需要大量的加密解密步骤,安全、效果、性能的三角往往难以平衡。 效果 ——全同态加密 ——联邦学习 ——多方安全计算 性能 2 安全性 对客户而言,其中最为重要的是安全性,需要隐私计算产品进行充分的安全自证。在技术层面将更多的依赖于源代码自证、安全假设模型验证,以及POC和实际应用中的业务安全性证明。 模型效果 据公开资料,采用隐私计算后,银行的反欺诈模型AUC在0.6-0.7之间,约有20%左右的下降。但由于隐私计算可以为业务方引入外部数据,能通过增加数据维度及规模提升效果。据多家厂商预估,隐私计算能够实现10%以上的效果提升。 相关性能 值得一提的是,除了间接限制隐私安全实现的保护效果外,相关性能资源供给是否充足,甚至会直接决定能否采用隐私安全相关产品 •通信效率 隐私计算本身是用于解决小数据间的聚合和综合利用问题,通信更加频繁。特别是参与的数据及子模型会横跨不同机构、计算集群、乃至地区间,进一步提升了对通信的要求。 •计算资源 由于采用了密文,隐私计算的复杂度显著上升,算力消耗增加。据2021年的数据,在显著提升后,多方安全计算比明文计算仍慢约25倍。算力问题已被视作隐私计算产业大规模落地必须解决的底层问题。 •存储空间 •工程化能力 但在从业人员看来,相对于其在数据安全流通的开创性意义,现有技术缺陷不足以影响产业发展。 但同时,由于实际业务模型及系统、实际加密需求等和实验室/POC阶段的条件不同,要确保实际业务价值落地,工程化也是各公司的提升重点(如实际运算效率、可承载数据规模、多方通信效率等)。 价值篇 隐私计算元年2020过后,隐私计算从实验室阶段进入了点状落地阶段。POC数量、招投标项目、投融资数额的增加都证明着隐私计算行业市场的繁荣。 然而,在翻阅了市场现有的估值逻辑、访谈了业内人士后,分析师认为,市场上对于隐私计算价值的估计仍相对浅显。在本报告中,我们会对隐私计算的价值进行完整还原,试图呈现出这一产业的价值天花板。 2.1技术价值分析 尽管现有分析和市场大多将隐私计算技术划

你可能感兴趣

hot

量子位隐私计算产业展望报告

信息技术
量子位2022-07-15
hot

中国隐私计算产业发展报告(2020-2021)

信息技术
国家工业信息安全发展研究中心2021-05-08
hot

2022中国隐私计算产业研究报告

信息技术
亿欧智库2022-11-03
hot

安恒信息2023全球隐私计算报告

信息技术
OpenMPC2024-01-18