| 隐私计算在医疗数据流通中的应用与实践 周海涛 仪电智慧城市设计研究院数据科学部主任 !"C$N&EN& 01 !"#$%&'( )*+, #789:;<= 03 )*>? 02 -./01234 )*56 @*ABCDEF 04 )*GH | | 01 智慧医院建设面临的新挑战 医疗数据合规流通是智慧医院建设的重要前提 | 国家发改委:2021年6月发布的“医疗卫生服务体系建设实施方案”要求推进跨地区、跨机构信息系统的互联互通、互认共享、术语规范以及数据的整合管理,建设主要疾病数据库和大数据分析系统。 国务院:2021年12月发布的“要素市场化配置综合改革试点总体方案”中明确要求卫生健康等高价值数据集向社会开放,在卫生健康等重点领域探索以数据为核心的产品和服务创新。 国家发改委等部门:2022年初发布的“‘十四五’公共服务规划”中明确要求推动服务数据互联互通,推进医疗卫生等重点领域数据信息交换共享,加快实现民生保障。 #$)*IJ%&KL )*%&' ?@ABCfi2035EFGH !¿#$ !"#$%&' )*M#KLNO (#$%&+, 2015年7月1日 ()*%&+, 2017年6月1日 (-.+, 2020年1月1日 (YZ%&+, 2021年9月1日 (ST7812+, 2021年11月1日 )*%&/01234 )*%&PQffi+ UVU01234 WXYZG[ YZ\]^_34 '(%) 56789:;<12=> YZ%&PQ34 (`+a,bc12 %& YZ%&PQ34 | hijYZ%&deHf"g /012deHf"g 5912deHf"g *+ | 智慧医院建设过程中,面临隐私保护与数据流通的矛盾问题,即如何在保护数据隐私的前提下,最大限度地挖掘医疗数据价值。 防泄漏 算法可靠 隐私保护 模型 安全 ·· ·· ·· 人工智能 全量 数据 分析价值 数据价值挖掘 数据安全与隐私保护 ,-./01234 qrST78 klYZ mnop 挑战:明文数据“管不住” | ······ 56789:;< 场景描述 患者定期随访:患者个人信息、诊疗数据、既往病史等信息涉及患者个人隐私,申请周期较长,并且数 据更新不及时,难以对患者进行及时的、准确的随访服务,对患者康复及居家疗养造成影响。 opYZ klYZ 9sYZ 挑战:数据流通“放不开” | ······ =>78ƒ@B 场景描述 制药公司药品研发:病史、诊疗、基因等数据作为药物研发的重要信息,因为受到法律法规和隐私保护 的限制无法直接提供给制药公司,影响了新药研发进程。真正有价值的数据就是敏感数据。 数据价值 数据安全 合法合规问题 协调工 作代价泄露 昂贵无法 溯源 审批数据 流程泄露 复杂风险 数据价值无法度量 数据有偏问题 | 如何建设一套合规、安全、高效的数据流通体系,是一个难题。 | 02 隐私计算技术发展的新动态 隐私计算privacypreservingcomputing 指在保证数据提供方不泄露原始数据的前提下,对数据进行分析计算的一系列信息技术,保障数据在流通与融合过程中的“可用不可见”。 权益分离 安全可控 保障双方权益 针对数据可复制性,实现与价值的部分分离 安全性可验证 从根本上解决数据泄漏风险问题,同时大幅降低合规成本 YZXtuvfiwxyz 隐私计算技术 YZ[_fibc12 价值流动 经济价值可流通 数据不动算法动,实现数据经济价值可挖掘利用与跨主体使用 1、成为“数据可用不可见”的主流技术 2、促进数据要素流通,使能价值倍增 | 3、保障数据安全,解决流转过程中隐私泄露的风险 | 聚焦的技术方向 多方安全计算是一类密码学安全协议,在无可信第三方情况下,允许互不信任的参与方根据自己的输入计算出一个函数,计算过程不泄露除输出结果以外的任务信息。 联邦学习是实现无需数据交换(只需参数交换)实现跨域数据上的机器学习联合建模,可以被认为是保护隐私的分布式协作机器学习。 可信执行环境是2010年GlobalPlatform提出的,通过创建一个可以在TrustZone的“安全世界”中独立运行的小型操作系统实现。 | !"#$% &'#$% ()*+ ,-#$% ,.#$% ÅÇÉÑ]~ ÖÜ=Ä á+]~ ÖÜ=Ä KLffi ä-ãåÖÜ =Ä %&PâÖÜ =Ä CDEFGHIJ áà]~ÖÜ=Ä |YZ]~ =Ä 安全计算在多方之间进行,需要构建复杂的多边信任关系。目前缺少对数据所有权、完整性的保护,数据易篡改,造成数据在流转时的信任度薄弱。 如何证明正确使用了原始数 据(数据投毒)? 如何证明模型有效性? 如何证明各方数据贡献度是可信的? 如何证明系统没有后门,参与计算的节点可信? 如何证明多方共谋导致的隐私泄露情况? 存证:对数据的产生、请求、使用、计算和服务均有证可录,进而有证可循。 不可篡改性/溯源,对被使用数据进行跟踪,对可能面临的恶意攻击进行追溯和惩罚。 激励机制:利用区块链的价值表示和转移功能,对联邦学习服务所创造的价值进行记账和利益分配,实现对各参与方的群体激励。 在数据流通过程中,隐私计算解决了“安全”问题,未解决“信任”问题! | 03 医疗数据安全流通的新思路 | 利用数据脱敏等技术,传递API接口,实现数据“可见才可用” 流通形式: •原始数据或简单预处理后直接共享 流通特点: •二次利用甚至滥用情况多发 •涉及的隐私信息暴露风险高 使用技术: •数据传输技术 不符合法律法规要求,风险过大 流通形式: •单方提供数据处理或分析结果 流通特点: •在一定程度上保护了隐私信息 •仍存在通过缓存的二次利用风险 •降低了数据价值融合的可行性 使用技术: •API接口技术 •数据脱敏等相关安全技术 数据流通模式1.0 直接传输原始数据 数据流通模式2.0 采用普通API接口 数据流通模式3.0 隐私计算技术赋能 临床数据库系统 本地计算端 内部安全控制域 本地计算端 科研数据库系统 内部安全控制域 子节点A 子节点B 全院信息汇聚中心 联邦学习模型训练 隐私保护计算平台 节点A本地计算汇总结果 节点B本地计算汇总结果 节点C本地计算汇总结果 临床研究 数据通过安全方式汇聚到全院信息汇聚中心并加密存放,数据不可见; 数据在隐私保护计算平台统一计算并赋能业务,数据价值可用。 医工交叉数据库系统本地计算端 内部安全控制域 多科室联合课题 | 医工交叉 子节点C 数据可用不可见 数据授权管控 加密的算法模型 隐私保护计算平台 医院计算平台 制药公司1计算结果安全加密存储 制药公司2计算结果安全加密存储 医院数据 患者隐私数据 制药公司B 制药公司计算客户端 制药公司A 制药公司计算客户端 数据流通模式3.0 隐私计算技术赋能 制药公司 | 流通形式: 采用隐私计算技术: 诊疗数据安全可控,其他科室或制药公司可用不可见, 全程合规,融合多方数据资源价值。 流通特点: ●价值挖掘:充分挖掘数据价值; ●保护隐私:不需要交换个体数据,数据加密计算; ●安全合规:符合数据安全相关法律; ●数据要素资产化:数据全生命周期可控; ●算法加密:对制药公司的算法加密,保护知识产权。 医院计算平台 标准类型医疗数据 个体病例相关数据 个体病例诊疗数据 相关医疗活动数据 第三方授权数据 1.申请数据 3.编写和调试数据分析程序 6.申请带走分析结果 7.审核通过返回结果 隐私计算技术 调试节点 2.数据抽样 4.代码发送至运行环境 5.返回全量运算结果 运行节点 隐私计算执行环境 全量数据 调试环境 样本数据 数据分析团队 技术亮点 数据可用不可见,数据不动模型动 数据不出门,交互的是算法模型、脱敏数据、运行结果 应用场景 AI智能医学影像 智能病历建模 医保精准控费 制药企业辅助研究 | …… | 04 创新理念不断打磨的新实践 案例分享-某市三甲医院骨科数据共享平台-内部共享的问题 每个月都要更新一次太麻烦了 数据准确性太差了 到底是谁泄露了数据 我想要的数据太难要了 这数据都脱敏了还看个啥 反正领导签字了,数据泄露和我没关系 急着要数据,但流程也太长了吧 敏感数据我可不敢给 | 又来申请数据了,烦死了 骨科医学影像智能分析 内部安全控制域 医院本部医学影像 数据库系统 本地计算端 本地化差分隐私处理 模型参数抽取 图像分割 模型训练 模型建立 内部安全控制域 本地计算端临床诊断 信息汇聚中心 子 节点A本地计算模型中间参数 点 节 节点B本地计算模型中间参数 本地模型迭代训练 A 辅助诊断 节点C本地计算模型中间参数 模型迭代参数 本地计算端 医院分部骨科影像 数据库系统 节 子隐私保护计算平台 点 内部安全控制域 B可信联邦学习模型训练 本地模型 某患者医学影像 病灶识别病灶分析 本地计算端 医院本部内分泌科诊疗数据 数据库系统 子节点 | 内部安全控制域 C参数同步相关方模型迭代 AI智能检测病灶,提高诊断效率 病情分析初判提醒,辅助诊断决策 | 医企合作模式要怎么定呢 怎么保证数据开放通路是安全的 从哪里追溯数据泄露点 数据给出去会有问题的吧 这个数据要怎么量化价值 哪些数据能开放,哪些不能呢 这是患者的数据,我说了不算 别说脱敏了,不脱敏我也不敢开放出来 这几个“法”怎么解读 | ----来自医院的真实吐槽 | 03 klijRS “三位一体”医疗数据开放运营平台整体设计:从数据流通、数据运营、数据决策三个维度,分别建立隐私计算子平台、运营管理子平台和决策监管子平台等三个技术支撑平台;建立健全数据开放管理流程、数据运营监管流程、数据安全管理制度等体系。 fghijX78hklXmnop 02 de^_RS Y]^_X`abcXdeRS 01 NOPQRS TUVWPQX78VWYZX[\RS | 01 NOPQRS 02 de^_RS 03 klijRS Y]^_X`abcXdeRS TUVWPQX78VWYZX[\RS fghijX78hklXmnop | | 在现有数据治理、信息化管理办法等基础之上,建立健全数据开放管理流程、数据运营监管流程、数据安全管理制度等体系。近期已经立项《智慧医院数据治理标准》、《基于隐私保护计算的医疗影像安全共享标准》 智慧医院数据治理标准 卫生健康标准 基于隐私保护计算的医疗影像安全共享标准 卫生健康标准 | | 非常感谢您的观看 |