您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[浙江数字医疗卫生技术研究院]:imit白皮书第二十七期发布:全球生物医药研发大数据集成平台观察 - 发现报告
当前位置:首页/行业研究/报告详情/

imit白皮书第二十七期发布:全球生物医药研发大数据集成平台观察

imit白皮书第二十七期发布:全球生物医药研发大数据集成平台观察

第 27 期 全球生物医药研发大数据集成平台观察 Globale-ResearchInfrastructureObservation:BiomedicalDataIntegrationPlatform 本期导读 生物医药产业创新BT+IT趋势显著,创新型基础设施在其中扮演重要角色。对此,本期白皮书聚焦生物医药产业人工智能大数据集成平台在全球范围内的建设、发展和趋势,与行业共享全球生物医药大数据集成平台建设最新动态,通过梳理深入认识支撑生物医药产业创新高质量发展的研发新基建,剖析我国在生物医药AI大数据集成平台建设发展上面临的挑战并提出发展展望。 imit战略咨询与研究中心 张建楠李莹莹周佳卉肖以君朱烨琳 致谢 本期白皮书系中国工程科技发展战略浙江研究院重大咨询项目“生物医药产业人工智能大数据集成平台发展战略研究”的成果之一,感谢在本项目中参与的院士、专家对项目提供的宝贵的意见与建议。 内容摘要 (一)认识生物医药研发大数据集成平台 介绍生物医药研发大数据集成平台内 涵,从生物医药领域、信息化、研发范式和规模化等多维视角深入认识生物医药研发大数据集成平台。梳理生物医药研发大数据集 成平台在重大科技基础设施趋势化发展下呈 现的演进规律和态势。阐明生物医药研发大数据集成平台集成化建设和集群化发展的作用与价值。 (二)生物医药研发大数据集成平台建设要素 剖析梳理集成平台建设赋能生物医药研发的核心要素包括算力资源、多模态数据资 源、工具和服务资源三个方面,以及平台建设运营和持续赋能的必要条件包括资金投 入、平台资源、外环境的支持和多方参与程度等方面。厘清并明晰了生物医药研发大数据平台建设、运营和可持续发展须实现的关键内容。 (三)全球生物医药研发大数据集成平台发展现状 概述了全球生物医药研发大数据集成平 台总体情况,重点就要素集成范式和公共集成平台分别进行典型案例的分析与介绍。从 组织建设、资金投入、平台体系搭建、服务提供等多方面研究梳理了多个国家和地区生物医药集成平台的建设和运营模式。 (四)我国生物医药研发大数据集成平台发展存在的问题 剖析了生物医药研发大数据集成平台发展存在的问题:1)生物医药研发大数据集成平台基础设施建设不足;2)数据共享、 流通、交易的基础制度体系建设不完善;3)生物医药数据平台数字化标准体系建设与应 用程度不够;4)可持续运营发展是当前大部分国内平台所面临的重要挑战。 (五)我国生物医药研发大数据集成平台发展展望 强调生物医药研发大数据集成平台的重要意义和战略地位,对我国生物医药研发大数据集成平台的发展作出展望。 生物医药研发大数据集成平台建设与发展是一个前沿的话题,本白皮书系团队研究分享,如有错误,请批评指正。 研究简介 (一)研究背景 十四五时期,生物经济进入加速发展期,基于数据驱动的智能化科学研究范式取得的 创新突破是下一步生物医药领域关键竞争 点。2021年12月,《国家“十四五”生物经济发展规划》提出,利用云计算、大数据、人工智能等信息技术,对治疗适应症与新靶点验证、临床前与临床试验、产品设计优化与产业化等新药研制过程进行全程监管,实现药物产业的精准化研制与规模化发展。面 对国内外产业发展的新趋势和新形势,我国生物医药产业旨在通过数字化和智能化的举 措,进一步增强创新研发实力,提升医疗服务水平,并加速产业的数字化转型。 (二)研究目标 生物医药研发大数据集成平台是实现生 物医药创新转型的重要基础设施,本期白皮书旨在梳理生物医药研发大数据集成平台的内涵、发展历程、作用与价值、发展新态势, 帮助读者建立对生物医药研发大数据集成平 台的整体认识;聚焦大数据和人工智能在生 物医药行业的平台建设和应用情况,与行业共享全球生物医药大数据集成平台建设新动 态;分析体现生物医药研发大数据集成平台核心价值的关键要素、建设运营和赋能的必要条件,让读者深入了解大数据集成平台全 生命周期的核心要素和必要条件,明确我国生物医药研发大数据集成平台所面临的挑战并呼吁共同发展。希望通过本期白皮书,能 够为国内生物医药大数据集成平台发展提供坚实参考。 (三)研究方法 本文收集国内外相关文献和资料并进行研究归纳、案例比较分析,梳理总结生物医 药研发大数据平台相关概念、作用与价值、发展新态势;同时选取国内有代表性的生物 医药领域的意见领袖进行深度访谈,收集全球生物医药大数据集成平台的建设发展情 况、运营情况和使用情况,最终通过综合分析讨论,明确问题并提出发展建议。 (四)浙江数字医疗卫生技术研究 浙江数字医疗卫生技术研究院(简称 “数研院”,imit®)是中国首家致力于数字与信息化技术在医疗卫生健康服务领域研 发与应用的专业性非营利研究机构(NPO/NGO),院长为杨胜利院士,理事长为李兰娟院士,常务副院长为郑杰先生。 数研院聚集众多业内的资深院士和专家 学者、全球著名的医疗保健设备厂商、国内外领先的行业软件企业来共同从事该领域的 研究开发、顾问咨询、认证评估、国际合作、成果转化等工作,并引领政、产、学、研、用、 资六位一体的公益事业公共服务支撑平台,进而营造出可生存可持续发展的数字医疗卫生产业链生态环境。 (五)版权说明 本白皮书版权属于浙江数字医疗卫生技 术研究院,并受法律保护。转载、摘编或其它使用本白皮书文字或观点内容,请注明“来源:浙江数字医疗卫生技术研究院”,若违反上述声明者,本院将追究其相关法律责任。 一、认识生物医药研发大数据集成平台 (一)生物医药研发大数据集成平台概述 1..生物医药研发大数据集成平台内涵 生物医药研发大数据集成平台是一个泛 称,泛指用于生物医药基础研究和研发的大数据集成平台,旨在加速生物医药领域的研究和研发过程效率。生物医药研发大数据集成平台包含的类型非常广泛,例如常见的基因数据库、药物研发监测数据库、医学文献知识库等数据库,健康医疗大数据平台、生 物信息数据平台、生物医药大数据中心等都被涵盖在生物医药研发大数据集成平台范围 内。平台通常至少拥有生物医学大数据和/ 或计算资源等作为核心集成资源。平台支持生物医药研发参与者通过系列大数据挖掘工 具、AI算法模型、基于工作流和可视化的工具等集成、整合和分析大量的生物医药领域数据,帮助研究人员更好地挖掘生命科学新发现、理解疾病机制、研发药物以及预测临床治疗效果等。 得益于新一代信息技术的快速发展,生物医药研发大数据集成平台的数字化和智能 化取得新进展,平台的功能和能力得以不断富集和拓展。信息集成、分发和编排等技术助力平台的建设,实现了多源、多模态的生物医药大数据资源汇集和数据挖掘、分析、处理、流通、应用等能力的嵌合。融合应用基于云和超算等算力设施,平台为研究人员提供更为方便、快速的访问和计算能力[1]。例如,基于云平台依托云存储等完成各种数据资源的经济存储、流通和应用;通过基于云的IPaaS(集成平台即服务)能力集成生物医药研发所需数据资源、算力资源、研发工具与服务[2]。平台资源类型、构件模块、架构方式、服务类型、功能效用等根据平台能级和适用场景范围的不同有所区分。 2..生物医药视角下的认识 生物医药研发大数据集成平台是生物医 药领域的重要基础设施。研发大数据集成平台在该领域的兴起和发展与生物医药学科和 产业的发展息息相关。长期以来,伴随生命科学、医疗健康和药物研发三个主要领域的发展,孕育产生了众多面向不同研究主题的、规模不一的生物医药研发大数据集成平台,新兴平台主要分布在如生物信息学、计算生物学、计算医学、计算药物学、临床流行病学等医学、药学、生物学与信息科学、数据 科学交叉的领域。现有生物医药研发大数据集成平台则是融合了上述生命科学和医药学以疾病研究为中心的研究资源的平台。 在生命科学领域,生物信息大数据集成平台的兴起和发展是生物医药领域基因组、蛋白组等组学大数据存储、管理和研究需要的结果。例如,欧洲生物信息学研究所 (EMBL-EBI,https://www.ebi.ac.uk/)数据平台拥有一套开放的数据资源和工具,涵盖了分子生物学中包括核苷酸序列数据、蛋白质序列、化学生物学和科学文献等各种数据资源,为科学界提供免费数据和生物信息学服务,支持各级科学家参与高级生物信息学培训,推进分子生物学的研究和理解,促进了生物学的发展(见图1)。 在医疗健康领域,医疗健康大数据平台的兴起和发展是医疗信息化发展、国家电子病历和健康档案、人口和流行病学统计等系列国家工程的产物。例如,中国国家人口健 康信息中心(https://www.ncmi.cn/)数据平台汇交存储和管理着国家医学健康数据资 源,包括面向国家政府资金资助的生物医学健康领域各级各类科技计划所产生的科学数 据、医疗卫生机构电子病历系统等数据、科技文献相关数据、医疗健康产业数据。 图1EMBL-EBI数据资源汇总[3](截止2023年8月) 在药物研发领域,文献知识大数据平台和工作流工程化平台等平台支撑了研究者和 研发人员开展基础研究和研发工作。例如,美国国家癌症研究所(NCI)的基因组数据共享(GDC)是一个数据共享平台(https://gdc.cancer.gov/about-gdc),旨在为癌症研究界提供统一的存储库和癌症知识库,以实现跨癌症基因组研究的数据共享,以支持精准医疗。它不仅仅是一个数据库或工具,还是一个可扩展的知识网络,支持癌症研究计划的基因组和临床数据的导入和标准化。此外,合成生物学等基于工作流工程化的大数据集成平台通过将机器学习、深度学习、图像识别、认知计算等系列AI技术有机嵌入至新药研发的各环节,如药物结构预测、药物靶标发现、新药分子设计及试验设计等,大大缩短新药研发过程,提升新药研发效率。 3..信息化视角下的认识 信息化视角下的生物医药研发大数据集成平台构成丰富,新兴技术如人工智能、云计算和大数据分析等的迅速发展,为研发平 台注入了持续发展的强大动力。这些技术赋 予平台更强大的数据处理和分析能力,使得科研人员能够更精准地解读海量的生物医药 数据,发现隐藏在数据背后的模式和趋势。不仅提升了研发效率,还加速了药物研发、 疾病诊断和治疗方法的创新。生物医药研发大数据集成平台发展至今大致有四个演进阶 段,且随着技术的不断演进正朝着更智能、更高效、更具前瞻性的方向迈进,为生物医药产业的进一步发展开辟了广阔的道路。四个阶段分别是: 一是数据库系统阶段,是一种专门用于收集、存储和管理生物医药信息和数据的计算机化系统。例如,美国国立生物技术信息中心(NCBI)维护的全球公共核酸序列数据库GenBank(https://www.ncbi.nlm.nih. gov/genbank/)通过在线查询或API访问的方式为全球科学家提供了无数种生物的DNA和RNA序列信息。 二是数据仓库阶段,是一个大规模数据存储和分析系统,用于整合和管理与基础研 究、研发、临床试验、市场分析等相关的数据,以支持研发过程中的复杂任务。例如,美国国家生物技术信息中心NCBI提供了广泛的 生物医学文献信息资源及其配套分析工具资 源,包括PubMed(生物医学文献数据库) 及其检索、过滤器等工具系统。 三是集成平台阶段,发展为综合型和/或主题型的研发能力集成系统,整合包括生物医药数据、分析工具、人工智能算法等生物医药研发能力资源,具备高级的数据整合、分析挖掘和预测能力。在平台架构上,生物医药研发大数据集成平台可以是分布式、集中式或是混合式的。例如,分布式的代表德国生物信息学基础实施网络de.NBI(https://www.denbi.de/)由八个相互连接的服务中 心和一个协调单位组成,为德国和整个欧洲的生命科学和生物医学研究人员提供生物信 息学服务和全面的计算资源。协同信息学和神经成像套件(COINS)是一个开源的集中式平台,该平台托管并提供来自全美18个以上站点的神经成像数据的编译、整理和传播服务。中国科学院上海营养与健康研究院 (SINH)上海生物医药大数据中心BDMC (https://www.biosino.