您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[腾讯]:解码DeepSeek, 构建医药行业新质生产力 - 发现报告

解码DeepSeek, 构建医药行业新质生产力

2025-03-10腾讯车***
AI智能总结
查看更多
解码DeepSeek, 构建医药行业新质生产力

解码DeepSeek, 构建医药⾏业新质⽣产⼒ 腾讯健康李慧 07 ⽬录 •从DeepSeek看⼈⼯智能发展趋势 •⼤模型及DeepSeek潜在应⽤场景探索 从DeepSeek看⼈⼯智能发展趋势 2024 AI离我们越来越近,越来越密集的“加速”信号 1950s CNN,⼈脸识别 Chatgpt,C端破圈 2017 “AI”概念⾯世 2012 Alpha,⼤战李世⽯ 2022 DS,“Aha”时刻 4 AI技术演变路线 •1987-2020年之前的主导是“⼤数据、⼩算⼒、专⽤决策范式”。 •2020年后,GPT-3代表技术路线“⼤数据、⼤算⼒、通⽤范式”,验证⼤语⾔模型的可⾏性。 •GPT3/4在深度推理和问题解决⽅⾯有所⽋缺,OpenAI-o1通过思维链(ChainofThought)增强推理能⼒,将复杂问题分解成更⼩、更易处理的步骤;⽽DeepSeekR1在展现卓越推理能⼒同时,训练和推理成本极低 GPT为内容创造和自动推理开辟可能性 “大数据、大算力、通用模式” DeepSeek-R1 BERT 基于DS-v3构建推理模型,通过强化学习提升推理能力,且训练成本极低 BERT在文本分类、命名实体识别等语言理解任务表现出色。也是医疗AI小模型年代主要技术路线 “大数据、小算力、专用决策” 数据来源:1.甲⼦光年智库梳理,2023年;5 理解Chatgpt,⼀个AI领域的“⼯程奇迹” 体验:哎哟不错噢 低成本,超出⽤户预期的“智能” 增长:破圈,两个⽉到⼀亿⽤户的速度 Chatbot: ⽂本交互式应⽤ Gpt3: 数⼗TB⾼质量数据 数万对⾼质量prompt “创新落后”的机会成本被不断放⼤ 产品:典型的2B能⼒集合 快速推出全家桶和云服务矩阵 预训练⼤模型 Promptengineering提⽰词⼯程 NvidiaA100(A800) ⾼性能卡 RLHF 强化学习 市场:典型的B端商业模式 快速市场预热和商业化 SFT 监督微调 顶尖的AI⼈才 RDMA 解决数据处理的延迟 6 再看DeepSeek,⼜⼀个“⼯程奇迹” DeepSeek是“深度求索”开发的⼀系列⼈⼯智能模型。DeepSeek通过持续的技术创新和市场拓展,在⾃然语⾔处理和⼤型语⾔模型⽅⾯取得了显著进展,在国际市场上获得了⼴泛认可。其中: •DeepSeek-V3是在14.8万亿⾼质量token上完成预训练的⼀个强⼤的混合专家(MoE)语⾔模型,拥有6710亿参数(激活参数370亿)。作为通⽤⼤语⾔模型,其在在知识类任务(知识问答、内容⽣成等)领域表现出⾊ •DeepSeek-R1是基于DeepSeek-V3-Base训练⽣成的强化推理能⼒模型,在 数学、代码⽣成和逻辑推断等复杂推理任务上表现优异 更低的研发成本*更⾼效资源利⽤ $5.5Mvs.OpenAI’s$100M+使⽤~2,000GPUs,竞品使⽤ 10,000+GPUs 开源模型⽐肩头部闭源 60%+指标优于Llama3.1Claude-3.5GPT-4o 打破⼤模型技术壁垒 重挫美国科技公司股价,英伟达市值下跌5,900亿 AI的斯普特尼克时刻 被美国及其盟友列⼊各种限制 数据来源:*仅涵盖预训练成本,不包含研发、推理、后训练、员⼯等其他成本;2.Sputnik时刻,指1957年10⽉4⽇苏联抢先美国成功发射斯普特尼克1号⼈造卫星,是冷战中的其中⼀个重⼤事件及转捩点7 DeepSeek的创新突破 效果体验惊艳,成本极致压缩 MoESparse(稀疏专家混合模型) •每次推理仅激活相关专家,“术业有专攻” FPB混合精度训练 •传统模型需要⽤32位或者16位数记录数字 •“专事专办、要事要办⼩事不办尽量不跨组解决” •节省42.5%训练成本 MLA(多头潜在注意⼒机制) •注意⼒机制⽐作图书检索系统 •MLA建⽴⼀个智能分类系统,不记具体信息,⽽是⼀个“简单”标签 •模型的占⽤率降低⾄传统的MHA5-13% NSA(原⽣稀疏注意⼒) •像学霸⼀样把注意⼒消耗降到最低 •“⼀⽬⼗⾏跳记重⼼记住题点”“ •“⼿机号码,记最后4位” •提升训练速度同时保持精度,降低硬件门槛 数据蒸馏技术 •从海量数据中提炼⾼价值信息,提升模型 学习效率 •蒸馏垂类⼩模型能⼒,不输于全尺⼨模型 GRPO(群体相对策略优化) •⼤道⾄简,⽤强化学习跳出题海和⼩测 让模型⾃⼰学会思考 8 为什么⼈⼈都爱DeepSeek? 成本优势 •550万美元预训练成本达到GPT-4级别性能,打破“算⼒军备竞赛”魔咒 •技术成本的下降,为 ⾏业上下游带来更多创新的可能 技术震撼 •算法、训练范式、推理、算⼒利⽤全⽅⾯创新 •DeepSeekV3通过快速迭代新技术,⼤幅降低了训练和推理的成本。 ⽽且它是个拥有推理能 ⼒的模型,全球可⽤ 开源引爆 •开源的论⽂和库,以及提供简易的蒸馏⽅式,让世界上不管⼤⼩的实验室,快速掌握OpenAI原来封闭的顶尖模型推理能⼒ •MIT许可证,商⽤权限吸引开发者 垂直适配 从编程辅助(DeepSeek-Coder)到医疗诊断(R1临床接⼊),展现⾏业落地能⼒ 9 DeepSeek天然适合医疗⾏业 ⼤模型发展的⼏⼤“基⽯” 02 DeepSeek创新技术引发新变化 01 计算资源 DeepSeek极致成本降低,显著降低本地化部署的成本,极⼤激活本地数据 算法框架 DeepSeek是最开源的⼤模型,便于医疗⾏业开发者使⽤和优化,垂类⼩模型不输于⼤模型 医疗⾏业独特优势 04 03 数据资源 医疗⾏业拥有⼤量数据资源,是⼤模型训练和应⽤的重要⽀撑 06 05 ⼈才资源 医疗⾏业⼈均学历⾼,具备开展⼤模型研究 和应⽤的⼈才优势 ⽣态资源 医疗信息化⼚家数千家,为⼤模型应⽤提供良好的⽣态基础 市场前景 医院、企业、监管、患者痛点多,场景丰富,市场潜⼒巨⼤ 10 DeepSeek虽好,但也不是“六边形战⼠” 幻觉⾼=“创造⼒税“底层⼤模型各有所长 •DS幻觉率更⾼,另外实际测试应⽤中有指令遵循较弱、 拒答率⾼等问题 •医疗领域幻觉⽐例甚⾄⾼达20-30%2 幻觉情况1 在落地过程中,仍需结合⼀定的应⽤框架(RAG、⼯作流、Agent等)和⼯程优化来保障⼤模型应⽤企业级端到端效果 数据来源:1.VectaraHHEM⼈⼯智能幻觉测试;2.腾讯健康内部测试数据,通过⾼质量医学病历数据 11 ⼤模型及DeepSeek潜在应⽤场景探索 DeepSeek会给医药企业带来哪些变化? 新药研发与临床试验 ⽣产与供应链 多渠道营销 学术化推⼴ 患者服务 提升新药研发和 临床管理效率 数字化内部流程 提效 数据驱动的多渠道营销 更个性化、互动 ⾏业学术化推⼴ 重塑患者流程 DeepSeek有哪些应⽤场景?能产⽣哪些价值? •患者招募 •试验设计优化 •执⾏效率提升 •交叉证据⽹络构建 •内部⽂档提效 •数字化知识库管理 •合规风险智能提醒 •内容⽣产辅助 •管理营销素材 •营销内容策划 •客户精细化标签 •个性化与医⽣互动 •多源信息来源 •互动性、个性化 患者流程 •多重购买渠道 13 医疗⾏业⾯临前所未有的挑战 ⼈⼝⽼龄化 医保捉襟见肘 医院艰难 药品集采5 研发回报下滑6 •收⼊受限与成本攀 •研发成本激增 亿美元 21.7% 11.9% •国家层⾯已开展10批集采,平均降幅50%-60%,极端降幅超90%5 •收⽀失衡加剧,控费边际效应减弱2 •职⼯医保:结余稳健但增速 下滑 •居民医保:收⽀失衡加剧 •65岁以上⼈⼝占⽐从2014年的10.1%升⾄2023年的14.9%,医疗需求激增1 覆盖损失的60% •药品收⼊占⽐从改⾰前的40%→25%,⽽财政补助仅 3 2018 2010 •现⾦流危机 *65+岁% 14.9% ⽀出增速收⼊增速 单个创新药上市成本 •成功率低 •美国创新药临床成功率仅5.1% •研发回报率低 IRR 10.1% 3.2% 2010 4.4% 20245.5% •2023年医疗机构应收账款回款天数平均为152天,⽐2022年增长2天4 10.1% 2014 202314.1% 7.9% 据,要数字” 新⽣ 2023 产要素在数据,“问数 数据来源:1.甲⼦光年智库梳理,2023年;2医疗保障事业发展统计快报,国家医保局;3.《解读财务分析报告:透视公⽴医院财务状况》,医院管理论坛报,2024年12⽉;4.《2023年药品流通⾏业运⾏统计 分析报告》,国家商务部;5.求解集采制度改⾰⽬标:“降价”是集采的惟⼀考量,澎湃新闻;6.创新药研发周期理论,创新药研发回报率研究,申银宏源;美国数据14 ⾏业视⾓:DeepSeek对于医疗体系有那些影响? 患者 •患者⾏为“消费者化”:医疗信息透明化,患者 有更多主动权 •“数字健康”和⽣态“破壁跨圈”,产⽣更多数据 •个性化诊疗和健康管理 医院 •电⼦病历和数据管理⾰新 ⼤模型语义理解加速医学数据治理和流通 •医院数据开放和流通 数据价值在⼤模型背景下进⼀步被凸显 •精细化运营管理(DRG/DIP) Ds推理思考能⼒以及医保控费压⼒ 医⽣ •学习/培训模式发⽣改变 •医⽣临床决策影响模式发⽣改变 •科研与学术⽅式和效率 监管 •数据驱动的精细化监管:⽐如药占⽐/集采vs药品经济学 •数据安全和合规重构 •多元⽀付体系(商业参与度更强) 15 DeepSeek对于医疗体系有那些影响?-患者 患者 超级产品 增长1亿⽤户所⽤时间 ⼤模型成为新的信息来源 •患者⾏为“消费者化”:医疗信息透明化,患者有更多主动权→⼤模型成为患者信息来源 •“数字健康”和⽣态“破壁跨圈”,⽐如可穿戴设备与AI分析相结合→⼤模型汇聚和分析数据 •个性化诊疗和健康管理→获取服务的路径发⽣改变 16 患者服务:⼤模型重塑患者旅程 ⽤户触达 潜在⽤户 ⽤户认知 •⽬标⼈群画像/潜在⼈群标签 (⽐如年龄、性别、主诉、现病史等) 体系性患者宣教 健康智能体 个性化患者建议 “⼤模型会替代搜索引擎,成为新⼀代精准流量⼊⼝” ⽤户⾏为 腾讯医典腾讯视频 线下就诊 视频号 健康智能体 精准服务推荐 腾讯健康健康智能体 “⼴泛教育”→“量⾝定制” “信息→服务”链路闭环 ⽤户依从性 健康药箱 “个⼈健康助理” ⼩程序公众号健康智能体 17 患者服务:从“千篇⼀律”到“精准匹配”信息和服务 个性化推荐医疗信息 •智能分析⽤户病情、并精准推荐宣教 识别⽤户现病史、⽤药和健康情况标签,关联就诊&药事服务 •分析⽤户现病史,健康状况,推荐关联科室医⽣ •结合⽤户咨询⽤药信息,提供药事以及药品购买的服务 引⽤⽂献 以腾讯健康为例 词条⾼亮 18 患者新旅程:终端+数据+AI+服务,AI串联全流程,激发新需求 信息精准传递 昨天健康回顾+健康⽇历 健康提醒 举例 医典科普检验报告/健康数据健康提醒 ⾏为健康新提醒 内容查看饮⾷建议健康/⽤药提醒运动break健康咨询睡眠 健康反馈⾏为 ⽤户 •根据⽤户数据,⾃动推送饮 ⾷建议或者运动 •根据⽤户健康规划,⾃动推送活动/饮⽔提醒 •⽤药提醒 •个⼈健康助理:个性化回复⽤户 ⽤户有关健康咨询 •结合⽤户拍摄的药盒、检查报告,⾃动解读、⾃动提醒 •结合⽤户数据,⾃动⽣成相关建议 数据+ 收到⽤户阅读提醒运动数据收集&反馈 睡眠数据收集&反馈 健康服务 AI⼤模型 •根据⽤户数据/输⼊,⾃动⽣成健康建议、今⽇运动/饮⾷规划 “精益求精”⽤户画像 •⾃动更新健康信息 •⾃动统计运动数据 •跟进运动⼩贴⼠(拉伸、补⽔) “细致⼊微”⾏为管理 •⾃动统计睡眠数据 •睡眠情况分析/健康⼩结 “极致简化”服务路径 •健康状况周期性AI反馈 •腾讯健康可⼀健拉起医⽣在线咨询、药品复购 ⽤户情绪曲线 今天⼜是活⼒满满的⼀天 今天也不要忘记好好照顾⾃⼰哦! 哇塞,饮⾷建议都有了~今天再也没有选择困难了 ⼯作有点累呢!想放松下 哇塞,提醒我要记得吃药! 原来喝⽔得喝够了才能减肥啊~新知识get!! 好累