*+,-4/012345 HappyLifeTech !"# $%&'()67689:;<= 精准医学(precisionmedicine)作为一个较新的概念,最早由美国国家科学研究委员会在《走向精准概医学》这一报告中提出。美国国立卫生研究院(NationalInstituteofHealth,NIH)给精准医学下的定念义为:一种建立在了解个体基因、环境及生活方式基础上的新的疾病治疗和预防方法。 HappyLifeTech 应用基因检测、现代遗传、分子影像、组学、生物信息、大数据等技术,根据患者的临床诊疗、组应用学数据、生活习惯和环境因素等信息,实现精准的疾病诊断,找出对疾病进行干预和治疗的最佳靶点,为临床实践提供科学依据,为患者“量身定制”个体化的疾病诊疗和预防方案,使患者获得最 适宜的治疗效果和最低副作用的一种医疗服务模式。 政治生活经济 精准预防 HappyLifeTech 群体疾病早筛新型预防医学 精准治疗 深入基因和肿瘤微环境,突破新药研发瓶颈 精准诊断 精准医疗四大环节 突破传统诊断,以基因测序技术和抗原抗体免疫反应为基础 精准预后 建立预后风险模型,辅助医生决策 国务院印发的《“十三五”国家战略性新兴产业发展规划》中,生物医药行业成为重点鼓励发展的行业。 2019.3 国务院“实施癌症防治行动,推 2021.12 《“十四五”医疗装备产业发展 规划提出,到2020年,生物产业规模达到8万亿~10万亿元。在医药领域,以基因技术快速发展为契机,推动医疗向精准医疗和个性化医疗发展。在资金方面,国家将在2030年前,在精准医学领域投入600亿元。 2015.3 科技部召开“精准医学”会议,决定投入600亿, 成立国家精准医疗战略专家委员会 2015.4 中国重点研发计划精准医学研究 重点专项,发布专项申报指南,并将精准医学正式写入国家“十三五”规划。 物产业发展规划》,加快发展精准医学新模式 HappyLifeTech 原则(2018年版)》,涵盖7大类肿瘤、42种抗 2017.1 国家发改委发布 《“十三五”生 癌药 进预防筛查、早诊早治和科研攻则被写进了 2018.9 国家卫健委发布 《新型抗肿瘤药物临床应用指导 《2019年政府工作报告》 规划》,新型高通量智能精准用药检测装备,成为首要重点发展领域。智慧医疗发展 精准医疗费用昂贵 国内基因测序价格昂贵 精准诊断除了收集患者信息及样本并进行生物信息学分析,还要结合医生的医疗知识进行精准判断 精准治疗需要个性化药物,为患者进行个性化治疗,其中涉及大量的费用问题 法律法规缺失和伦理挑战 医疗信息数据库的建立涉及隐私,如何保证数据安全与共享 患者及医护人员对数据信息拥有什么权利与义务 在保障精准医学良好发展的前提下,最大限度地保护患者的权益 硬件技术及软件差距 当前我国精准医疗的重要设备和前沿技术主要依靠进口,在该领域自主创新和研发能力较弱 缺乏具有精准医学知识的医疗技术人员,对精准医疗认识与掌握不够,相关专业人才缺口较大 数据库建立受阻 HappyLifeTech 信息收集、数据共享、生物样本共享是精准医疗发展的重要环节 我国还没有完全开放的医疗数据库,各大医院以自身拥有的信息数据资源为优势相互竞争 数据共享举步维艰,医学数据库基础平台的建设任重而道远 HappyLifeTech 生态系统2.0‒科技赋能,证据驱动重塑疾病精准治疗创新生态 1 人工智能赋能疾病筛查和辅助诊断 利用AI算法在授权情况下嵌入医院EMR或C端使用场景(如互联网)提高筛查和诊断效率 2构建数字化诊疗体系 建设跨院的数据平台,实现院际转诊和多学科会诊,促进优质医疗资料合理分配 C端场景二级医院三级医院 互联网医院 药房 随访检测 患者管理线上中心 互联网处方 送药上门患教内容 患者社群 … 3 患者全病程管理 为患者打造一站式管理平台,提高疾病自我 管理能力 HappyLifeTech 数据应用DataApplication 应用场景多样(管理、科研、诊疗、教学) 用户需求个性化、专业化、精准化 安全性及合规性要求极高 数据处理DataProcessing 大量文本、图像等非结构化数据 行业标准不统一,难以复用 专业性强,细分领域多 数据集成DataIntegration 多系统异源异构数据 数据质量参差不齐,不完整性显著 数据分散、规模大、增长迅速、冗余性强 康复病历评测评定治疗处方 问卷调查体检记录监测记录 检验 检查 护理 手术 康复 模型重构 HIS LIS EMR RIS 手麻 超声 重症 内镜 放疗 病理 输血 心电 护理 核医学 病案 基因 生理监测 介入报告 检查管理 介入导管 检查报告 检查管理 处方/医嘱药品类非药品类 HappyLifeTech 病人就诊诊断临床路径转科 管理输血 输血观察评价不良反应 透析 病历记录护理记录 检查申请手术申请输血申请治疗申请检验申请 申请 随访方案结果 病理 病理管理病理报告 检验微生物基因HLA骨穿 生命体征护理观察护理操作护理记录管路管理入院评估出院评估护理计划评分 术前访视麻醉记录术后访视手术记录 病历 病案首页入院记录首程日常病程查房记录转科记录抢救记录会诊记录死亡记录出院记录门急诊急诊留观 放疗 放疗记录 费用发票费用明细 健康管理 全面覆盖医院各系统各场景的可扩展的患者信息模型 研究背景 念珠菌血症是ICU患者的严重疾病负担,治疗的及时性非常关键 HappyLifeTech 念珠菌血症是ICU患者最为常见的侵袭性真菌病,是ICU患者死亡的主要疾病之一,且进展迅速,治疗的及时性严重影响患者预后 虽然高危因素可以指导医生怀疑念珠菌血症患病可能性,但念珠菌血培养通常耗时3天左右,等阳性检测结果出具后再进行干预,患者死亡率极高 研究目的 在SIRS患者中早期发现念珠菌血症患者 构建一个可用于三甲医院ICU住院的SIRS患者发生念珠菌血症风险的预测模型,预测当患者出现SIRS时,其发生念珠菌血症的风险,以辅助临床工作者早期发现念珠菌血症患者 当预测模型判断患者为“高危状态”时,可建议医生尽快开展临床干预; HappyLifeTech 研究前期梳理 的特征 数据整合 HappyLifeTech 数据清洗特征设计 通过伦理授权收集数据 数据归一和结构化 专家咨询 查阅医学文献 带特征标签的患者数据 最终模型 建立数据训练集和测试集 调参建模 评估模型 准备有正负样本的数据集 使用N折交叉验证 训练机器学习模型,如逻辑回归,支持向量机(SVM),决策树(DecisionTree),随机森林(RandomForest),Xgboost等相关算法 评估标准:TPR(Sentivity)、TNR(Specificity)、PPV(阳性预测值) 最终根据得分边界值对患者分组 高危 中危 低危 如不满足,重新按上述流程迭代 模型是否 满足评估标准建模 最大的问题 0.96 0.92 (总体分类准确度) HappyLifeTech 150:150200:10 平衡数据中阴阳类样本都能较好的识别不平衡数据中阳性样本的识别很差 模型构建 特征选择 平衡样本量 HappyLifeTech 对每一个正样本 选择K个近邻(图中k=3) 该正样本和每一个K个近邻样本连线选取连线上随机一点为新样本 生成新样本x1=x+ζ1⋅(x(k)−x)(0<ζ1<1) 特征选择 平衡样本量 模型构建 HappyLifeTech 逻辑回归LR SVM线性核 随机森林RF、极端随机树ET(分类树) XGBoost(回归树) flod1 flod2 模型训练 Smote1Model1 flod3 评估指标 …… …… flod4 模型训练 SmoteN ModelN 评估指标 flod5 训练集 测试集 HappyLifeTech 1 将符合条件的研究对象分为训练集和测试集 2 划分方法:按照5折交叉验证 3 样本量平衡:构建训练集合时,通过smote算法进行样本量平衡,由于smote算法的随机性,每次CV时,进行两次smote算法平衡 4 用训练集构建模型,用测试集进行预测效果评价,目前采取Sensitivity、Specificity、PPV为评估指标 模型判断 特征向量 利用不同的机器学习模型对患者样本进行分层,以筛选出最优的分类模型 Score<=0.03 低风险人群 模型 Score>0.03 高风险人群 需要医生及时关注及时用药 HappyLifeTech 通过机器学习训练的念珠菌血症预测模型 收集数据计算相关特征 通过文献研究、专家访问和病历学习,提炼某种疾病高风险因素的规则 㡮僈 HappyLifeTech !"#$%&'()*+ICM/C0123456789:;<=>)?@ABCDEFGHIJ+!"#IKLBC'(5BCMNIOP ?@QRIST!"#UVWX'(YZBC [\]X^_I`$ab5 HappyLifeTech