解码DeepSeek 构建医药业新质产 腾讯健康李慧 07 录 从DeepSeek看智能发展趋势 模型及DeepSeek潜在应场景探索 从DeepSeek看智能发展趋势 2024 AI离我们越来越近,越来越密集的“加速”信号 1950s CNN脸识别 ChatgptC端破圈 2017 “AI”概念世 2012 Alpha战李世 2022 DS“Aha”时刻 4 AI技术演变路线 19872020年之前的主导是“数据、算、专决策范式”。 2020年后,GPT3代表技术路线“数据、算、通范式”,验证语模型的可性。 GPT34在深度推理和问题解决有所缺,OpenAIo1通过思维链(ChainofThought)增强推理能,将复杂问题分解成更、更易处理的步骤;DeepSeekR1在展现卓越推理能同时,训练和推理成本极低 GPT为内容创造和自动推理开辟可能性 “大数据、大算力、通用模式” DeepSeekR1 BERT 基于DSv3构建推理模型,通过强化学习提升推理能力,且训练成本极低 BERT在文本分类、命名实体识别等语言理解任务表现出色。也是医疗AI小模型年代主要技术路线 “大数据、小算力、专用决策” 数据来源:1甲光年智库梳理,2023年;5 理解Chatgpt个AI领域的“程奇迹” 体验:哎哟不错噢 低成本,超出户预期的“智能” 增长:破圈,两个到亿户的速度 Chatbot: 本交互式应 Gpt3: 数TB质量数据 数万对质量prompt “创新落后”的机会成本被不断放 产品:典型的2B能集合 快速推出全家桶和云服务矩阵 预训练模型 Promptengineering提词程 NvidiaA100(A800) 性能卡 RLHF 强化学习 市场:典型的B端商业模式 快速市场预热和商业化 SFT 监督微调 顶尖的AI才 RDMA 解决数据处理的延迟 6 再看DeepSeek个“程奇迹” DeepSeek是“深度求索”开发的系列智能模型。DeepSeek通过持续的技术创新和市场拓展,在然语处理和型语模型取得了显著进展,在国际市场上获得了泛认可。其中: DeepSeekV3是在148万亿质量token上完成预训练的个强的混合专家MoE语模型,拥有6710亿参数(激活参数370亿)。作为通语模型,其在在知识类任务(知识问答、内容成等)领域表现出 DeepSeekR1是基于DeepSeekV3Base训练成的强化推理能模型,在 数学、代码成和逻辑推断等复杂推理任务上表现优异 更低的研发成本更效资源利 55MvsOpenAI’s100M使2000GPUs竞品使 10000GPUs 开源模型肩头部闭源 60指标优于Llama31Claude35GPT4o 打破模型技术壁垒 重挫美国科技公司股价,英伟达市值下跌5900亿 AI的斯普特尼克时刻 被美国及其盟友列各种限制 数据来源:仅涵盖预训练成本,不包含研发、推理、后训练、员等其他成本;2Sputnik时刻,指1957年104苏联抢先美国成功发射斯普特尼克1号造卫星,是冷战中的其中个重事件及转捩点7 DeepSeek的创新突破 效果体验惊艳,成本极致压缩 MoESparse稀疏专家混合模型) 每次推理仅激活相关专家,“术业有专攻” FPB混合精度训练 传统模型需要32位或者16位数记录数字 “专事专办、要事要办事不办尽量不跨组解决” 节省425训练成本 MLA(多头潜在注意机制) 注意机制作图书检索系统 MLA建个智能分类系统,不记具体信息,是个“简单”标签 模型的占率降低传统的MHA513 NSA原稀疏注意 像学霸样把注意消耗降到最低 “跳记重记住题点”“ “机号码,记最后4位” 提升训练速度同时保持精度,降低硬件门槛 数据蒸馏技术 从海量数据中提炼价值信息,提升模型 学习效率 蒸馏垂类模型能,不输于全尺模型 GRPO群体相对策略优化 道简,强化学习跳出题海和测 让模型学会思考 8 为什么都爱DeepSeek 成本优势 550万美元预训练成本达到GPT4级别性能,打破“算军备竞赛”魔咒 技术成本的下降,为 业上下游带来更多创新的可能 技术震撼 算法、训练范式、推理、算利全创新 DeepSeekV3通过快速迭代新技术,幅降低了训练和推理的成本。 且它是个拥有推理能 的模型,全球可 开源引爆 开源的论和库,以及提供简易的蒸馏式,让世界上不管的实验室,快速掌握OpenAI原来封闭的顶尖模型推理能 MIT许可证,商权限吸引开发者 垂直适配 从编程辅助(DeepSeekCoder)到医疗诊断(R1临床接),展现业落地能 9 DeepSeek天然适合医疗业 模型发展的“基” 02 DeepSeek创新技术引发新变化 01 计算资源 DeepSeek极致成本降低,显著降低本地化部署的成本,极激活本地数据 算法框架 DeepSeek是最开源的模型,便于医疗业开发者使和优化,垂类模型不输于模型 医疗业独特优势 04 03 数据资源 医疗业拥有量数据资源,是模型训练和应的重要撑 06 05 才资源 医疗业均学历,具备开展模型研究 和应的才优势 态资源 医疗信息化家数千家,为模型应提供良好的态基础 市场前景 医院、企业、监管、患者痛点多,场景丰富,市场潜巨 10 DeepSeek虽好,但也不是“六边形战” 幻觉“创造税“底层模型各有所长 DS幻觉率更,另外实际测试应中有指令遵循较弱、 拒答率等问题 医疗领域幻觉例甚达20302 幻觉情况1 在落地过程中,仍需结合定的应框架(RAG、作流、Agent等)和程优化来保障模型应企业级端到端效果 数据来源:1VectaraHHEM智能幻觉测试;2腾讯健康内部测试数据,通过质量医学病历数据 11 模型及DeepSeek潜在应场景探索 DeepSeek会给医药企业带来哪些变化? 新药研发与临床试验 产与供应链 多渠道营销 学术化推 患者服务 提升新药研发和 临床管理效率 数字化内部流程 提效 数据驱动的多渠道营销 更个性化、互动 业学术化推 重塑患者流程 DeepSeek有哪些应场景?能产哪些价值? 患者招募 试验设计优化 执效率提升 交叉证据络构建 内部档提效 数字化知识库管理 合规风险智能提醒 内容产辅助 管理营销素材 营销内容策划 客户精细化标签 个性化与医互动 多源信息来源 互动性、个性化 患者流程 多重购买渠道 13 医疗业临前所未有的挑战 龄化 医保捉襟见肘 医院艰难 药品集采5 研发回报下滑6 收受限与成本攀 研发成本激增 亿美元 217 119 国家层已开展10批集采,平均降幅5060,极端降幅超905 收失衡加剧,控费边际效应减弱2 职医保:结余稳健但增速 下滑 居民医保:收失衡加剧 65岁以上占从2014年的101升2023年的149,医疗需求激增1 覆盖损失的60 药品收占从改前的4025,财政补助仅 3 2018 2010 现流危机 65岁 149 出增速收增速 单个创新药上市成本 成功率低 美国创新药临床成功率仅51 研发回报率低 IRR 101 32 2010 44 202455 2023年医疗机构应收账款回款天数平均为152天,2022年增长2天4 101 2014 2023141 79 据,要数字” 新 2023 产要素在数据,“问数 数据来源:1甲光年智库梳理,2023年;2医疗保障事业发展统计快报,国家医保局3《解读财务分析报告:透视公医院财务状况》,医院管理论坛报,2024年124《2023年药品流通业运统计 分析报告》国家商务部5求解集采制度改标:“降价”是集采的惟考量澎湃新闻;6创新药研发周期理论,创新药研发回报率研究,申银宏源;美国数据14 业视:DeepSeek对于医疗体系有那些影响? 患者 患者为“消费者化”:医疗信息透明化,患者 有更多主动权 “数字健康”和态“破壁跨圈”,产更多数据 个性化诊疗和健康管理 医院 电病历和数据管理新 模型语义理解加速医学数据治理和流通 医院数据开放和流通 数据价值在模型背景下进步被凸显 精细化运营管理(DRGDIP) Ds推理思考能以及医保控费压 医 学习培训模式发改变 医临床决策影响模式发改变 科研与学术式和效率 监管 数据驱动的精细化监管:如药占集采vs药品经济学 数据安全和合规重构 多元付体系(商业参与度更强) 15 DeepSeek对于医疗体系有那些影响?患者 患者 超级产品 增长1亿户所时间 模型成为新的信息来源 患者为“消费者化”:医疗信息透明化,患者有更多主动权模型成为患者信息来源 “数字健康”和态“破壁跨圈”,如可穿戴设备与AI分析相结合模型汇聚和分析数据 个性化诊疗和健康管理获取服务的路径发改变 16 患者服务:模型重塑患者旅程 户触达 潜在户 户认知 标群画像潜在群标签 (如年龄、性别、主诉、现病史等) 体系性患者宣教 健康智能体 个性化患者建议 “模型会替代搜索引擎,成为新代精准流量” 户为 腾讯医典腾讯视频 线下就诊 视频号 健康智能体 精准服务推荐 腾讯健康健康智能体 “泛教育”“量定制” “信息服务”链路闭环 户依从性 健康药箱 “个健康助理” 程序公众号健康智能体 17 患者服务:从“千篇律”到“精准匹配”信息和服务 个性化推荐医疗信息 智能分析户病情、并精准推荐宣教 识别户现病史、药和健康情况标签,关联就诊药事服务 分析户现病史,健康状况,推荐关联科室医 结合户咨询药信息,提供药事以及药品购买的服务 引献 以腾讯健康为例 词条亮 18 患者新旅程:终端数据AI服务,AI串联全流程,激发新需求 信息精准传递 昨天健康回顾健康历 健康提醒 举例 医典科普检验报告健康数据健康提醒 为健康新提醒 内容查看饮建议健康药提醒运动break健康咨询睡眠 健康反馈为 户 根据户数据,动推送饮 建议或者运动 根据户健康规划,动推送活动饮提醒 药提醒 个健康助理:个性化回复户 户有关健康咨询 结合户拍摄的药盒、检查报告,动解读、动提醒 结合户数据,动成相关建议 数据 收到户阅读提醒运动数据收集反馈 睡眠数据收集反馈 健康服务 AI模型 根据户数据输,动成健康建议、今运动饮规划 “精益求精”户画像 动更新健康信息 动统计运动数据 跟进运动贴(拉伸、补) “细致微”为管理 动统计睡眠数据 睡眠情况分析健康结 “极致简化”服务路径 健康状况周期性AI反馈 腾讯健康可健拉起医在线咨询、药品复购 户情绪曲线 今天是活满满的天 今天也不要忘记好好照顾哦! 哇塞,饮建议都有了今天再也没有选择困难了 作有点累呢!想放松下 哇塞,提醒我要记得吃药! 原来喝得喝够了才能减肥啊新知识get 好累啊脑快转不动了 舞动极光太好玩了 10分钟,我感觉活过来了 要不在忍会,我定会瘦 是不是真多要过午不?可是我的真的好饿啊 幸好我问了AI健康助理 有点困了,表提醒我该睡觉了 噪帮助我眠 拍照药盒可以直接键下单,太便了! 19 DeepSeek对于医疗体系有那些影响?医 基于DeepSeek推理模型,整合患者的信息,辅助医深度问诊、鉴别诊断、病情分析和建议,提出治疗、预防等建议 基于Deepseek模型,再现医临床思维链路的推理模型 动成病情分析、IDC动编码 分析准确率达90,为医提供权威决策持 指出权威出处(如指南、专家共识等) 基于DeepSeek病历讨论助 科研助 医 学习培训模式发改变交互性、个性化学习模式 医临床决策影响模式发改变从经验驱动 基于医学搜索、循证医学证据的驱动 科研与学术式和效率通过模型进科研课题筛选、献收集、数据结构化提取和分析、摘要及初稿撰写等 20 学术推:千千,让销售拜访更专业、更效 医画像AI问答助话术智能推荐拜访记录成 21 新式 AI辅助实践,实践中提升能 代表培训:AI辅导,实战中提升专业能 法 辅导培训考试 线上线下拜访 语动转录拜访字 AI打分与建议 辅导 培训考试真实世界对 代表学习改进,在下次拜访中做的更好 未反映真实平:培训与拜访脱节,实战能难考察 考