如何新组学数据和深度学习加速癌症生物标志物的发展 由安吉拉奎博士,医学博士,转化医学高级副总裁,全球生物标志物和基因组医学负责人翻译 生物标志物对于诊断癌症、评估其进展以及确定哪些患者将最能从精确靶向治疗中获益至关重要。它们允许赞助商通过选择合适的患者并最大化他们将对治疗产生反应的机会,同时最小化副作用,来设计更高效、更快的试验。然而,许多癌症尚无可靠和合格的生物标志物。在帕瑞塞尔,我们利用下一代分析工具和技术,帮助客户识别可以在后续开发中得到验证的诊断、预后和预测性生物标志物。我们邀请了安吉拉奎描述多组学和计算分析在精准肿瘤学中如何加速生物标志物的发现和验证。 问题:您能简要描述最新的多组学数据吗? 科学家们最初从基因的DNA(基因组学)和基因在RNA水平上的表达(转录组学)以及蛋白质产物(蛋白质组学)入手。我们还需要了解化学标记如何开启和关闭基因,但又不改变DNA序列(表观遗传组学)。所有这些过程都与整个人类代谢(代谢组学)相互作用,我们也必须考虑这一点。总而言之,我们将这些不同的数据流称为“组学”。它们已经改变了我们寻找和验证癌症生物标志物的方式。 癌细胞逃避免疫系统和靶向治疗的控制后,不受限制地增殖,导致疾病进展。限制它们这么做对于患者及其家人至关重要。科学家最近开始研究特定解剖背景下的基因组内容及其活性(空间基因组学)。这令人兴奋,因为它可能会在精确肿瘤学的临床前和临床研究中带来巨大的变革。癌细胞难以杀死,因为它们存在于一个三维的、快速变化的环境中。通过绘制肿瘤的局部微环境,我们可能更好地理解恶性肿瘤如何避开免疫细胞的监视,并继续在身体特定位置获取富含营养的环境。 问:多组学数据如何驱动生物标志物的发现? 传统生物标志物测量一种模式(如单个基因(或一组基因)的蛋白质表达或特定类型的循环细胞)的水平或存在。多组学越来越多地使我们能够构建更复杂的混合生物标志物,这些生物标志物可能更准确地诊断、预测和预测患者预后。 最近,我们帮助一家正在开发联合疗法治疗实体瘤的公司发现了一个预测性生物标志物。我们指派了我们内部生物标志物和基因组医学团队中具有计算生物学和统计遗传学专门知识的科学家来支持这项工作。该项目极为复杂,因为它结合了多个数据层级,包括循环肿瘤DNA(ctDNA)、细胞因子、组织和 液体活检和成像数据。目标是为构建并验证一个复合生物标志物或生物标志物集,其能够区分应答者与非应答者,因为在这一具有挑战性的癌症中,没有任何单一信息级别,例如一个基因中的突变,已经产生了预测性生物标志物。Parexel的科学家与赞助商现场合作,分析他们的数据,提炼见解,并总结和报告结果。这种高度有效的合作模式持续为多个客户提供新的方法和创新生物标志物。 许多公司正在努力寻找预测性生物标志物,以识别对联合疗法反应良好的患者。预测癌症患者联合两种靶向疗法的治疗影响是一项复杂的任务。在这种情况下,赞助商进行了大量投资 ,因为他们打算将为此项目精炼的分析方法应用于他们靶向肿瘤治疗方案的整个组合中。 问:近期人工智能机器学习深度学习领域的进步是否影响该领域? 计算人工智能分析在机器学习(ML)和深度学习(DL)方面的进步,使我们能够将传统组学与新组学,如空间基因组学相结合。组学数据的体量不断扩展,如此庞大的数据量没有这些强大的新工具我们无法理解。 例如,机器学习深度学习可以自动化从组织病理学中获取的成像数据的处理和分类,这些数据用于诊断和预测癌症患者及其对治疗的反应。数字化组织病理学对数字化玻片图像中捕获的细胞和组织生物学的视觉解释需要模式识别和分析。如果没有自动化这一历史上手动的过程,非传统性、综合生物标志物的出现将是不可能实现的。 问:人工智能机器学习深度学习是否已经产生了具体成果? 绝对!我们计算科学家最近与一家大型制药公司合作,以改进现有肺癌组织分型方法。联合科研团队利用来自专有和公共数据源的全切片图像,包括《癌症基因组图谱》(TCGA)(一个可公开访问的存储库,包含丰富的基因组、表观基因组、转录组和蛋白质组数据,总数据量超过两拍字节),训练了一个深度神经网络。目标是提高分型方法的准确性、特异性和灵敏度。通过应用基于人工智能机器学习深度学习的计算病理学算法,我们开发了几个有潜力的方法论方法,这些方法可能有助于不久后诊断其他癌症或癌症亚型。 在另一个成功的项目中,我们的生物标志物和基因组医学团队与赞助商紧密合作,应用了一种新颖的深度学习(DL)方法来分析嵌合抗原受体(CAR)T细胞显微镜玻片成像数据 ,这实现了免疫细胞的自动表征。该算法在区分细胞表型特征方面表现出高预测准确性。我们仍在完善和验证这一方法,但它对CART细胞疗法和细胞成像生物标志物的发现和开发具有重大前景。我们对免疫的理解中存在持续的差距。 在癌症环境,包括不同类型的免疫细胞。监测这一微观环境可以让我们量化治疗方案对免疫细胞的影响,因为显微镜可以治疗前和治疗后进行观察,而如深度学习等方法可以在更复杂的维度上分析细胞特征。 问:开发生物标志物公司面临的最大挑战是什么? 大多数专注于肿瘤学的公司都渴望整合生物标志物,因为他们认识到其在临床开发中的价值 。看到越来越多的肿瘤药物开发者考虑收集和正确存储患者样本以进行生物标志物研究是令人鼓舞的。然而,在完成初步的探索性生物标志物研究后,他们往往低估了生物标志物在技术、分析和临床验证方面所需的努力。 技术验证涉及确认检测方法能够准确且可重复地测量其预期测量的内容。临床验证要求一项临床研究证明生物标志物与反应或安全性信号相关,无论其意图如何。为了正确验证生物标志物,您需要提前规划。例如,临床研究必须具有足够的效力(招募足够大的样本量)以验证生物标志物。公司还必须确定是否存在可以作为研究比较标准的金标准生物标志物。 许多公司在生物标志物研究中对高变异性和异质性感到惊讶。患者群体、实验室性能和资质 、测试平台以及样本处理等方面都存在可变性。这些因素可能影响生物标志物的性能,必须在验证过程中加以解决。例如,确保不同实验室、平台和研究地点之间试验方法的标准化是一个相当大的挑战。目标是保持一致性和稳健的测试兼容性。在Parexel,我们指导赞助商进行试验方法选择、选择合适的实验室以及在开发和验证过程中优先考虑技术因素。 Q什么是让你在这个工作中保持灵感的事物? 看到人工智能和其他分析进步加速癌症药物开发并提供直接的患者利益,这令人鼓舞。我们很自豪能成为这段旅程的一部分。您需要一个诊断生物标志物以进行准确的诊断,一个预后生物标志物以分层患者群体,以及一个预测生物标志物以找到最有可能产生反应的患者。这些帮助于精确靶向治疗的试验中有时令人筋疲力尽的纳入排除标准,并指导现有治疗方法的用药。 生成新的洞察力并与赞助商合作解决具体问题,这是我们实现精确肿瘤学承诺并为更多患者带来福祉的方式。我认为,能够领导并与由大约50名具有基因组学和遗传学、生物分析、计算生物学、统计学遗传学和数据工程专业知识的天才科学家组成的Parexel全球生物标志物团队合作,是一种特权。与这个非凡的团队合作,我深受启发,每天都被激发去分享我的知识和学习新事物! 潜在撤回报价 计算人工智能分析方面的进步,包括机器学习(ML)和深度学习(DL),使我们能够将传统组学与新组学,如空间基因组学相结合。 我们的计算科学家最近与赞助商合作,改进了现有用于肺癌组织分型的方法。联合科学团队利用来自专有和公共数据源的全切片图像,包括癌症基因组图谱,训练了一个深度神经网络。 许多公司对生物标志物研究中存在的高度变异性和异质性感到惊讶。在患者人群、实验室性能和质量认证、测试平台以及样本处理等方面都存在变异。