
欧盟委员会研讨会报告《基于数据驱动项目的癌症领域景观规划——更佳合作与整合的理据与方向》 第一次研讨会:2023年10月26日第二次研讨会:2023年11月15日第三次研讨会:2023年12月5日 欧盟委员会研讨会报告《基于数据驱动项目的癌症领域景观规划——更佳合作与整合的理据与方向》 欧盟委员会B - 1049比利时布鲁塞尔 编辑: 通讯网络、内容和技术总署(DG CNECT),CNECT.H3医疗健康、福祉与老龄化单元•欧洲委员会研究与创新总署(DG RTD),-单元RTD.D2健康创新与生态系统,-单元RTD.D1抗疾病——癌症使命秘书处,-单元RTD.A4开放科学与研究基础设施,-单元C4欧洲原子能共同体研究。•卫生与食品安全总署(DG SANTE)健康数字化单位(Unit SANTE.C1)及健康政策跨部门单位(Unit SANTE.B1)•欧洲研究执行机构(REA),C4单元改革欧洲研发和研究基础设施•欧洲卫生与数字执行机构(HaDEA),A3健康研究单位联系人: 目录 Contents 免责声明3 缩写4 1.导言61.1研讨会基本原理61.2研讨会目标61.3研讨会概念和参与者72.数据驱动的园林绿化癌症项目73.上的数据驱动项目面临的挑战癌症94.需要协调的主题和支架104.1访问数据-技术和法律考虑104.2Data互操作性124.3癌症的可持续性数据资源155.整合癌症数据生态系统欧洲186.在正在进行的项目之间建立项目级协同作用和合作项目197.对合作和支持的思考行动217.1对未来的建议行动228.Summary and结论22附件1 -相关的欧共体政策优先事项和活动24附件2 -参与项目和基础设施29 免责声明 本报告代表了参加欧洲委员会于2023年10月至12月期间组织的三次关于癌症研究与护理数字化解决方案工作坊的参与者们的观点和意见。它并不代表欧洲委员会的官方立场,并不包含对任何未来行动的承诺。 缩写 AI人工智能CT计算机断层扫描数字数字欧洲方案DIPG弥漫性脑桥内胶质瘤DSA数据共享协议DTA数据传输协议EBCP欧洲战胜癌症计划ECEuropean CommissionECIR欧洲癌症不平等登记ECIS欧洲癌症信息系统ECRIN欧洲临床研究基础设施网络EDIC欧洲数字基础设施联盟EHDS欧洲卫生数据空间EHRs电子健康记录EMA欧洲药品管理局EU欧洲联盟FAIR可查找、可访问、可互操作和可重用GDI欧洲基因组数据基础设施GDPR一般数据保护条例HaDEA健康和数字执行机构HDAB健康数据访问机构HE地平线欧洲HTA卫生技术评估H2020地平线2020IHI创新健康倡议JRC联合研究中心ML机器学习NSCLC非小细胞肺癌OECD经济合作与发展组织 PROs患者报告的结果REA研究执行机构RIs研究基础设施RWD真实世界数据RWE真实世界的证据SMEs中小企业VREs虚拟研究环境 1.Introduction 本报告概述了欧盟资助项目及欧洲研究基础设施关于癌症数据与基于数据的方法在癌症研究中讨论的内容。这些讨论是在2023年10月至12月期间,由欧洲委员会(EC)与研究执行署(REA)以及健康与数字执行署(HaDEA)合作组织的三次研讨会框架内进行的。 1.1研讨会的基本原理 在过去几年中,欧盟资助的癌症领域项目和倡议产生了大量数据,包括使用不同数字基础设施收集的敏感人类健康数据,旨在推进癌症患者的预防、预测、诊断、预后和治疗,以及提高癌症患者及其幸存者的生活质量。 这些项目在不同的欧盟计划下得到资助,具有不同的焦点,例如:基础研究和临床研究、基因组学、技术发展、健康与护理的数字化转型、欧洲数据战略和开放科学。其中一些项目是在癌症任务或欧洲打击癌症计划(EBCP)的特定框架下启动的。它们通常涉及大型的合作体,这些合作体包含多个跨项目的共同受益者。 为了高效利用资金并实现最大影响,这些由欧盟资助的癌症项目必须利用现有的协同效应和互补性以避免重复努力,并确定合作领域。它们还应该以更知情和理性的方式专注于主要的欧盟政策文件,尤其是“欧洲抗癌计划”、“癌症使命”和“欧洲健康数据空间(EHDS)”,同时利用现有基础设施,特别是数据基础设施。 1.2研讨会目标 研讨会的总体目标是提升欧盟支持在更广泛的癌症研究与创新领域的影响力。更为具体地说,研讨会系列旨在:1.加强欧盟在癌症研究和创新领域的政策制定和实施能力。2.推动跨学科合作,促进不同研究领域之间的知识交流和资源共享。3.提升公众对癌症研究重要性的认识,增强社会对创新成果的接受度和支持力度。4.识别和解决当前癌症研究和创新中面临的挑战,提出有效解决方案。5.增进欧盟与其他国际组织、国家和地区在癌症研究和创新方面的合作,共同推动全球癌症防治工作。 评估参与项目和倡议所提供的可用资源(数据、工具、方法论和服务);确定协同作用、互补性和潜在的合作领域;识别与可用数据类型、统一概念模型、联邦架构、治理、安全可控访问机制等相关的关键差距领域;决定加强合作的共同优先领域,和/或需要额外支持;在需要的情况下,试探性地探讨这些问题如何能通过项目联盟具体实施,得到相应的欧盟服务的支持。在项目之间和与委员会服务之间建立对话;传达欧盟政策优先事项并澄清概念,以便项目能够以知情的方式对齐各自的数据努力。 1.3讲习班概念和参与者 2023年秋季举办了三次在线研讨会,面向欧盟资助项目和欧洲科研基础设施的合作成员,广泛探讨了人工智能(AI)和数据科学在癌症研究与医疗领域的应用。 欧盟委员会与执行机构合作识别了项目和基础设施。共有39个由欧盟资金支持的项目,在“地平线2020”(H2020)、“地平线欧洲”(HE)、“EU4健康”、创新健康倡议(IHI)和数字欧洲(DIGITAL)资助计划下获得支持,并且多个欧洲研究基础设施响应了参与交流的邀请。 在研讨会之前,参与的项目完成了在线调查,包含有关项目范围、使用和生成数据来源、解决的用例、挑战以及对欧盟政策的贡献等多个问题。所有参与的项目均同意与其它参与者分享其调查回复内容及其联系方式,旨在建立合作并探讨可能的协同效应。 在第一次研讨会上”癌症中数据驱动项目的介绍和美化在第二次研讨会中,选取了三个深入讨论的主题。欧洲委员会(EC)服务引入了如“欧洲抗癌计划”、“癌症使命”和“欧洲健康数据空间”等EC优先事项。参与者进行了多个简短的项目展示,随后与所有参与者进行讨论以完成整体概述。在第二次研讨会中,选择了三个主题进行深入的后续讨论。 在第二次研讨会上”关于需要协调和支持的癌症数据主题的讨论在一场全体会议上,讨论了三个主题:“数据访问——技术与法律考量”,“数据互操作性”和“癌症数据资源的可持续性”。会议包括多个参与项目的展示。讨论揭示了需要更多合作、协调或额外支持的若干领域和问题。 在第三次研讨会上”对未来合作和支持行动的思考在几个正在进行的项目中建立的协同作用被展示出来。在分组讨论会中,从研讨会参与者收集了关于增强合作的进一步具体步骤以及欧盟支持所需的需求和优先领域的想法和输入。 2.数据驱动的癌症项目 参与交流的项目利用AI和数据科学对抗癌症。超越推动肿瘤学领域的发展,它们还致力于改善患者护理、增强医疗保健系统以及促进跨边界的癌症研究合作更广泛的愿景。 项目范围和重点 几个项目解决了为了促进健康相关数据的二次使用,发展数据和研究基础设施以便利研究与访问例如,HealthData@EU Pilot旨在建立一个用于二次利用健康数据的基础架构;而EOSC4Cancer正在开发一个跨欧洲基础设施,允许从患者诊断到治疗的跨境数据分析。IMI-Bigpicture正在开发一个平台,将数字病理学数据存储库与人工智能算法相结合,以促进AI支持的预临床和病理学研究。IDEA4RC构建了一个针对罕见癌症的研究基础设施,GDI部署了欧洲基因组数据基础设施,EUCAIM部署了包含癌症图像及相关临床数据的欧洲基础设施,用于在癌症领域开发和基准测试AI解决方案,而IDERHA则构建了一个... 整合肺癌数据以进行监管和健康技术评估(为了HTA目的。PHIRI是一个人口健康信息研究基础设施,包含关于COVID-19对乳腺癌护理影响的试点使用案例。ECRIN是一个欧洲临床研究基础设施网络,处理包括癌症研究领域的临床研究数据。BBMRI-ERIC生物银行和生物分子资源研究基础设施基于超过10,000名癌症患者的样本和数据构建了一个虚拟结直肠癌患者群体(CRC-Cohort),作为一个进一步研究的资源。 许多项目地址AI和机器学习(ML)在癌症检测和治疗中的应用例如,ProCAncer-I正在开发和验证用于检测前列腺癌、预测疾病复发以及支持患者分层的新型AI模型。类似地,INCISIVE支持医疗保健专业人员使用AI决策支持服务的相关用例,特别是在癌症异常的分类和定位方面。DECIDER利用机器学习和AI方法来预测患者的治疗反应,并识别最有效的治疗选项。 几个项目关注癌症数据,使用AI工具和/或联合学习来诊断和治疗特定类型的癌症例如,iToBoS正在开发一个基于人工智能的诊断平台,用于早期检测黑色素瘤,而COMFORT正在研发一个决策支持系统,该系统利用人工智能和数据驱动的洞察力来为前列腺癌和肾癌提供支持。FLUTE正在开发隐私保护跨边界数据集利用的方法,重点在于诊断临床意义的前列腺癌。 另一个重要的用例是真实世界证据(RWE)在临床决策中的应用。这包括指南和现实世界的数据(基于RWD的决策支持系统、上市后药物评估以及为政府、监管机构和支付者提供的RWE生成服务。例如,OPTIMA利用RWE用于多种用途,包括虚拟队列临床试验生成、患者报告结果分析以及解决新型研究问题。 此外,几个项目侧重于改善癌症治疗的数据整合例如,NEWROAD通过整合多种数据源探索肿瘤领域的系统性药物再利用,而其他项目则可能涉及不同的研究方向或应用。使用AI工具来管理异构数据集比如AIDAVA。 项目中使用和生成的数据源 项目采用了多样化的跨学科数据来源,包括临床实践数据、人体样本数据和临床试验数据。例如,i-Violin利用了CT检查的图像数据及其关联元数据;在DECIDER中,收集并序列化了卵巢组织、血液样本以及患者的临床数据。PHIRI利用了癌症登记处数据、医院和初级保健的电子健康记录(EHR)以及索赔数据,而NEWROAD则运用了临床数据、药理学数据、基因组数据、药物反应数据、病理学数据以及EHR数据。 总 体 而 言 , 不 同 的 项 目 和 举 措 高 度 重 视FAIR( 可 发 现 、 可 访 问 、 互 操 作 、 可 重 用 ) 数 据 原 则 ( 例 如EOSC4Cancer、EUCAIM、Euro-BioImaging、IMI-Bigpicture、IDERHA),其中许多采用联邦学习方法(如EUCAIM、PHIRI或OPTIMA)。为了挖掘真实世界数据的潜力,诸如ONCOVALUE的项目收集患者报告的结果(PROs)。通过穿戴设备和智能设备(如智能手表)收集RWD也在项目中有所体现(例如eCANJA、ASCAPE)。IDEA4RC利用了已有的电子格式数据,包括结构化和非结构化数据。 就欧洲研究基础设施(RIs)而言,一些机构负责存储、生成并提供科研数据,例如生物和生物医药影像数据(Euro-Bioimaging)。另一些专注于纯医疗健康型研究数据,如ECRIN与临床试验数据的合作。最后,还有一类是混合型的,同时关注科研和医疗健康型研究数据,如 与数字病理数据、整合型医疗生物银行合作,并从样本中生成如蛋白质组学、代谢组学和影像学等基因组学数据的BBMRI-ERIC。 有价值的数据资源和工具是或将由项目产生。例如,ProCAncer-I生成了一个语义注释的影像和临床数据集,源自欧洲和土耳其的13个临床中心,包含了回顾性和前瞻性数据。此外还生成了器官和病变