2024年3月 变革性 计算生物学 提供更聪明的指南 IshitaDas,PhD,Ti夫anyRolle,PhD,和CaraAltimus,PhD 关于我们 关于米尔肯研究所 米尔肯研究所是一个非营利性的,无党派的智囊团,致力于在通往有意义的生活的道路上加速可衡量的进步。我们专注于财务、身体、精神和环境健康,汇集了最好的想法和创新资源,通过现在紧迫的事情和接下来的事情来制定解决一些最关键的全球问题的蓝图。 关于MI慈善事业 MI慈善推动慈善资本的战略部署,以创造一个更美好,更公平的世界。 关于科学慈善研究与合作加速器 米尔肯研究所的科学慈善研究与合作加速器(SPARC)与慈善家合作,制定全面的战略,并启动和领导高影响力的科学和面向健康的研究计划。 ©2024米尔肯研究所 这项工作是根据知识共享归因-非商业-NoDerivatives4.0International的条款提供的,可在 http://creativecommons.org/licenses/by-nc-nd/4.0/. 本文不构成任何形式的投资、法律、科学或监管建议。 前文 计算生物学是一个独特的领域,通过提供新的途径来应对疾病理解,诊断和治疗方面的一些最持久的挑战,将技术变革的快速步伐与全球影响的潜力相结合。 本指南致力于规划出加速该领域的潜在领域,强调它可能对全球卫生结果产生的变革性影响。通过慈善参与,我们有机会快速跟踪研究突破,带来即时变化并改善数百万人的生活。 通过对计算生物学的投资,慈善家为癌症和心血管疾病等疾病的理解和治疗做出了根本性的转变,这些疾病影响着世界各地的社区。历史上第一次,我们现在可以开发人工智能系统,使诊断方法民主化,识别疾病预防的新机会,并提供个性化护理。 私人慈善事业在帮助填补计算生物学的资金缺口方面发挥着独特的作用,突破了医学研究和转化影响的界限。今天进行的战略投资可以扩大新型诊断,治疗和预防措施的发展,这些措施可以在短短几十年内产生规模影响。 我们希望本指南能激励其他人帮助加速计算生物学在全球健康中的未来。Sanjit和HopeBiswas 创始人,Biswas家庭基金会 CONTENTS 1执行摘要 2满足科学和系统需求的慈善机会 3计算生物学概述 3人工智能背景 4在从研究到护理的范围内使用计算工具 11全球社区对AI医学的投资 13美国关键利益相关者和资金概述 13美国联邦对计算生物学的资助 16大学和医疗保健系统 17行业:生物技术和制药公司 17慈善事业 21跨部门伙伴关系和合作 22慈善支持的跨领域机会 23慈善机会1:改进和扩展大规模开放数据倡议和基础设施 23慈善机会2:支持必要的跨学科劳动力的发展和培训 25慈善机会3:通过试点研究和扩展基础设施访问将计算工具集成到研究和护理中 26慈善机会4:扩大临床应用计算工具的实施 28Conclusion 29附录:美国政府其他举措、大学计划和制药合作伙伴关系的快照 29美国政府在医疗保健中使用AI的政策 30在大学建立的倡议和伙伴关系 32个使用AI方法的制药项目和合作伙伴关系 35参考文献 40Acknowledgments 40关于作者 执行摘要 2022年11月,OpeAI的聊天机器人ChatGPT的发布引发了公众对人工智能(AI)的关注和理解。在此之前,人们已经从新闻,媒体和电影中收集了AI的一般概念。然而,随着ChatGPT的发布,免费使用一个强大的工具使世界各地的人们能够体验人工智能现在拥有的承诺及其未来的潜力。 来自各行各业的领导者争先恐后地了解这种新的AI工具,并意识到该技术已经发展到可以改变业务和社会功能的状态。关于这种新兴和快速发展的技术的实际和道德用途的对话在2023年主导了时代精神。 随着人工智能越来越多地融入社会和日常生活的各个方面,生物医学研究和医疗保健生态系统是具有巨大影响和利益潜力的领域。 AI的原理与更大的计算生物学学科相交,这是一个跨学科领域,涵盖计算机科学,数学,生物学,统计学,信息学和大数据分析的概念。计算生物学专注于使用数学建模,模拟,分析,统计方法和算法开发来开发,改进和将计算方法应用于基于生物学的问题。这些工具和技术可以快速识别大量数据中的模式,以提高我们对生物系统和复杂相互作用的理解,从而得出适用于人类健康的发现和预测。计算生物学概念正被纳入生物医学生态系统的许多方面,以应对跨研究学科和疾病领域的挑战。 虽然医学界认识到人工智能革命改变全球健康的潜力,但在该技术在这个领域充分发挥潜力之前,仍有许多挑战有待解决。2023年,米尔肯研究所科学慈善研究与合作加速器(SPARC)与Biswas家庭基金会合作,进行了全面的景观,以促进对国家的更多了解。ofthecomputationalbiologyfieldandidentifyareaswherephilizicsupportcouldenactakeyroleinrealizingthepotentialofAIforhealthandmedicine.This提供更智能的指南描述了新兴趋势,关键利益相关者,融资模式,进展的关键障碍以及慈善组织唯一适合解决的机会领域。我们相信这些机会将指导有兴趣在 人工智能和医疗保健的交叉,以便可以利用这些技术来改善全球社区的健康和福祉。 满足科学和系统需求的慈善机会 在此概述的机会提供更智能的指南通过对科学文献的全面审查,对公共和私人资助模式的审查,以及与包括学术界,工业界,研究机构,政府实体和非营利组织在内的多个部门的50多位专家和利益相关者的对话。这些人代表了从基础科学到临床护理的研究范围。SPARC发现了四个机会,慈善投资可以加速和优化生物医学研究和临床护理中计算工具的集成,从而对人类健康产生重大影响。 机遇1:改进和扩展大规模开放数据计划和基础设施。为了使计算方法产生积极影响,将需要大量的综合研究和临床数据。慈善投资可以帮助建立所需的基础设施支持,以创建,改进和增强标准化和完整的大规模开放数据计划。 机会2:支持必要的跨学科劳动力的发展和培训。为未来建立计算生物学劳动力是所有进一步进步的基础。慈善资助可以支持各种方法,确保个人在这个跨学科领域接受培训,以促进计算生物学工具的有效开发和实施,以改善人类健康。 机会3:通过试点研究和扩展的基础设施访问,将计算工具集成到研究和护理中。许多大学和卫生系统缺乏必要的基础设施和资源,以在其生物医学研究和临床护理活动中有意义地应用计算工具。慈善资本通过支持创新工具的发现和资助可能不会吸引其他资助者的高风险试点项目来填补这些空白。然后可以扩大这些项目,以在研究和护理生态系统中产生更重要的影响。 机会4:扩大临床应用计算工具的实施。研究集中在临床环境中计算工具的转化影响目前缺乏足够的资金。这些工具必须经过严格的评估和验证,以便将新方法纳入临床护理最佳实践和标准。慈善事业可以通过资助模型评估和促进患者护理工具部署来支持医疗保健中计算工具的实施。 计算生物学概述 随着为这个跨学科领域提供动力的技术的迅速发展,计算生物学最近经历了许多进步。计算生物学是生物学,大数据和计算机科学的纽带,其中计算工具用于挖掘和分析大量的生物和临床信息。计算工具的应用有可能彻底改变我们研究、预防和治疗人类疾病的方式 。然而,生物医学生态系统的独特性质带来了必须克服的具体挑战,才能充分实现这些工具帮助人们寿命更长和更健康的承诺。 人工智能背景 生物医学生态系统产生大量的生物和临床数据,突出了在整个生物医学研究连续体中整合计算方法的机会-从基础科学和 将研究转化为临床应用和更广泛的公共卫生计划。管理,分析和使用生物医学数据需要结合人工智能等计算工具。人工智能涵盖了创建系统和算法的广泛学科,这些系统和算法可以以“智能方式”执行广泛的任务,包括做出预测和解决问题。AI包含不同的子字段,各种术语描述了AI的其他方面,尤其是随着领域的发展。图1概述了其中一些术语以及它们是如何相关的。 AI 人工智能 ML NLP DL LLM 机器学习(ML):AI子集具有学习信息的系统,并在呈现更多数据时 适应这种学习(人类的干预最少)。ML模型经过训练,可以使用大量信息进行简单的线性预测和“学习” 迭代改进。 GENAI 创成式AI:任何基于从数据中获得的知识生成新内容的AI系统。 深度学习(DL):一种ML,需要非常大的数据集,并使用算 法层生成人工神经网络(互连节点或 神经元)来处理数据和识别模式,类似于人脑是如何运作的。 自然语言处理(NLP):使机器能够理解人类语言的AI子集 通过结合计算机科学、语言学和机器学习。计算机程序被训练为跨不同语言翻译文本、响应命令、总结大量文本以及完成语音到文本的听写。例子包括虚拟助理(例如,Siri、 Alexa)和利用LLM(例如ChatGPT)的聊天机器人。 大型语言模型(LLM):ML/DL模型的类型,可以执行NLP任务,例 如生成文本(因此也可以是生成AI的一种形式)。LLM是基础模型 ,在大量文本数据上进行训练,可以捕获语言中的复杂模式,并生成对提示或查询的响应。 ML/DL工具是预测性统计模型,随着新数据的出现,它们会不断发展、学习和改进。这些工具在许多行业都有应用,包括自动驾驶汽车,语音/语音识别以及图像分类等计算机视觉技术。DL模型可以预测比ML模型更复杂的关系,因此对于理解复杂的生物系统很有用。 图1:人工智能概述 资料来源:米尔肯研究所综合(2024),改编自Rahmat(2023)和Halejak(2023) :研究所计算生物学:更聪明的人指南3 在从研究到护理的范围内使用计算工具 生物医学研究已经进入了一个时代,大量的数据不断产生,新技术变得越来越容易获得。只有使用计算工具,才能整合,分析和理解来自各种来源的这些数据。在整个生物医学生态系统中整合此类工具对于进一步了解基础生物学机制,推进转化研究并增强临床护理以获得更好的患者结果具有巨大的希望。 基础生物学研究:使用计算工具可以加速对生物过程,疾病机制,网络相互作用和分子结构的理解。 翻译研究:整合临床数据和计算方法可以导致创建新的AI工具并改善药物发现。 临床应用:在临床中实施计算工具可以帮助诊断,预测健康结果和个性化治疗策略。 跨越生物医学生态系统的计算工具 在本节中,我们首先概述了生物医学研究数据和临床数据正在快速产生的关键领域,然后重点介绍了计算生物学具有巨大潜力的关键示例,可以影响这些数据的整合和分析,从而改善研究和护理。 基础生物学研究 在基础生物学研究中,过去十年的技术进步使大量生物学数据的产生成为可能,特别是在两个主要领域:(1)测序技术和(2)蛋白质结构预测。计算工具的并发进步产生了新颖的方法,这些方法揭示了发现,并更好地理解了生物过程和系统在人体内的工作方式。计算生物学的发现已经开始揭示大量基因和蛋白质如何以高度复杂的方式相互作用以实现正常的细胞功能,以及如何改变分子机制以驱动疾病进展。 测序技术的进步 示例:使用测序数据的DL模型的应用 分析了DL模型单细胞RNA测序数据从超过13,000个细胞从死后阿尔茨海默病脑组织,以提供对疾病机制的额外见解。使用计算工具进行分析单细胞RNA测序数据从600,000个细胞为了识别疾病和健康心脏之间的转录活性差异,以便更深入地了解心肌病.集成的DL模型多组数据来自一群700个人最近诊断与2型糖尿病为了更好地了解几种糖尿病药物的作用方式,目的是开发更个性化的治疗方法。Geneformer是一个DL基础模型,对来自周围的数据进行了训练3000万个单细胞转录组从广泛的人体组织中获得基本的生物学知识。然后,该模型被应用于其他较小的数据集,并能够准确预测已知的致病基因变异。然后,Geneformer被用于进一步了解心血管疾病的分子机制预测可能相关的基因与心肌细胞的发育和功能(心肌细胞)。 作为人类基因组计