国产开源MoE模型DeepSeek-V2性能媲美GPT-4,大模型价格战拉开帷幕 核心观点: 事件:5月7日,知名私募巨头幻方量化旗下的AI公司DeepSeek发布全新第二代MoE大模型DeepSeek-V2。 性能直逼GPT-4Turbo,综合能力位于大模型第一梯队。DeepSeek-V2是一个参数为2360亿的MoE模型,每个token仅激活210亿参数,支持128K的上下文长度。1)纵向对比:对比去年11月发布的DeepSeek67B性能取得显著提升,训练成本节省了42.5%,KV缓存减少了93.3%,最大生成吞吐量提高到了5.76倍。2)横向对比:上下文长度对标GPT-4Turbo(128K);中文综合能力(AlignBench)超越Llama3,在开源模型中表现最强,与文心4.0等闭源模型在评测中处于同一梯队,仅次于GPT-4Turbo;英文综合能力 (MT-Bench)与最强的开源模型LLaMA3-70B处于同一梯队,超过MoE开源 模型Mixtral8x22B。此外在知识、数学、推理、代码等方面也有出色的性能。 DeepSeek-V2训练计算量降低,推理能力表现高效。DeepSeek-V2训练数据集是由8.1Ttoken的高质量、多源预训练语料库组成,采用的Transformer架构中由一个注意力模块和一个前馈网络(FFN)组成,并且在注意力机制和FFN方面采用了创新架构:一方面设计了MLA(Multi-headLatentAttention)利用低秩键值联合压缩来消除推理时键值缓存的瓶颈,DeepSeek-V2消耗的显存(KVCache)只有同级别Dense模型的1/5-1/100,每token成本大幅降低;另一方面,FFN采用高性能MoE架构DeepSeekMoE,以经济的成本训练强大 的模型。我们认为,DeepSeek-V2大幅提升训练效率,训练所需计算量约为 GPT-4的1/20,但性能基本上相差无几,目前来看参数是影响大模型性能的关键因素之一,除此之外,架构优化能有效提升降低训练成本,提升训练效率,将成为另一个影响大模型性能的关键因素。 API价格降至约GPT-4Turbo百分之一,大模型价格战即将拉开帷幕,利好AI应用层快速渗透。目前DeepSeek-V2API定价为每百万token输入1元、输出2元(32K上下文),几乎低于所有市面上主流大模型价格,约为G PT-4Turbo的1/100。我们认为,DeepSeek-V2提升数据集质量及优化架构,成本大幅降低,在价格方面提升竞争力,大模型将逐渐进入价格战时期,AI应用将快速渗透。 投资建议:国产大模型迭代加速,训练成本降低,进一步加速应用端落地,而应用端推广又将进一步催生算力新需求。建议重点关注:1、国产算力:海光信息、中科曙光、神州数码、曙光数创、润泽科技;2、大模型及多模态:科大讯飞、昆仑万维(传媒覆盖)、万兴科技、拓尔思、海康威视、大华股份、商汤-W(0020.HK);3、AI医疗:嘉和美康、卫宁健康;4、AI办公:金山办公、彩讯股份;5、AI教育:科大讯飞、欧玛软件、拓维信息;6、AI法律:通达海、金桥信息、华宇软件;7、AI金融:恒生电子、财富趋势、同花顺;8、AI能源:国网信通、国能日新等。 风险提示:技术研发进度不及预期风险;供应链风险;政策推进不及预期风险;消费需求不及预期风险;行业竞争加剧风险。 计算机行业 推荐维持评级 分析师 吴砚靖 :(8610)66568589 :wuyanjing@chinastock.com.cn分析师证书编码:S0130519070001 研究助理胡天昊 :(8610)80927637 :hutianhao_yj@chinastock.com.cn 相对沪深300表现图 资料来源:Wind,中国银河证券研究院 行业点评报告●计算机行业 2024年5月12日 www.chinastock.com.cn证券研究报告请务必阅读正文最后的中国银河证券股份有限公司免责声明 行业点评报告/计算机行业 分析师承诺及简介 本人承诺以勤勉的执业态度,独立、客观地出具本报告,本报告清晰准确地反映本人的研究观点。本人薪酬的任何部分过去不曾与、现在不与、未来也将不会与本报告的具体推荐或观点直接或间接相关。 吴砚靖TMT/科创板研究负责人 北京大学软件项目管理硕士,10年证券分析从业经验,历任中银国际证券首席分析师,国内大型知名PE机构研究部执行总经理。具备一二级市场经验,长期专注科技公司研究。 免责声明 本报告由中国银河证券股份有限公司(以下简称银河证券)向其客户提供。银河证券无需因接收人收到本报告而视其为客户。若您并非银河证券客户中的专业投资者,为保证服务质量、控制投资风险、应首先联系银河证券机构销售部门或客户经理,完成投资者适当性匹配,并充分了解该项服务的性质、特点、使用的注意事项以及若不当使用可能带来的风险或损失。 本报告所载的全部内容只提供给客户做参考之用,并不构成对客户的投资咨询建议,并非作为买卖、认购证券或其它金融工具的邀请或保证。客户不应单纯依靠本报告而取代自我独立判断。银河证券认为本报告资料来源是可靠的,所载内容及观点客观公正,但不担保其准确性或完整性。本报告所载内容反映的是银河证券在最初发表本报告日期当日的判断,银河证券可发出其它与本报告所载内容不一致或有不同结论的报告,但银河证券没有义务和责任去及时更新本报告涉及的内容并通知客户。银河证券不对因客户使用本报告而导致的损失负任何责任。 本报告可能附带其它网站的地址或超级链接,对于可能涉及的银河证券网站以外的地址或超级链接,银河证券不对其内容负责。链接网站的内容不构成本报告的任何部分,客户需自行承担浏览这些网站的费用或风险。 银河证券在法律允许的情况下可参与、投资或持有本报告涉及的证券或进行证券交易,或向本报告涉及的公司提供或争取提供包括投资银行业务在内的服务或业务支持。银河证券可能与本报告涉及的公司之间存在业务关系,并无需事先或在获得业务关系后通知客户。 银河证券已具备中国证监会批复的证券投资咨询业务资格。除非另有说明,所有本报告的版权属于银河证券。未经银河证券书面授权许可,任何机构或个人不得以任何形式转发、转载、翻版或传播本报告。特提醒公众投资者慎重使用未经授权刊载或者转发的本公司证券研究报告。 本报告版权归银河证券所有并保留最终解释权。 评级标准 评级标准 评级 说明 推荐: 相对基准指数涨幅10%以上 评级标准为报告发布日后的6到12个月行业指数 行业评级 中性: 相对基准指数涨幅在-5%~10%之间 (或公司股价)相对市场表现,其中:A股市场 回避: 相对基准指数跌幅5%以上 以沪深300指数为基准,新三板市场以三板成指(针对协议转让标的)或三板做市指数(针对做 推荐: 相对基准指数涨幅20%以上 市转让标的)为基准,北交所市场以北证50指数为基准,香港市场以摩根士丹利中国指数为基准。 公司评级 谨慎推荐:中性: 相对基准指数涨幅在5%~20%之间相对基准指数涨幅在-5%~5%之间 回避: 相对基准指数跌幅5%以上 联系中国银河证券股份有限公司研究院 机构请致电: 深圳市福田区金田路3088号中洲大厦20层 深广地区: 程曦 0755-83471683 chengxi_yj@chinastock.com.cn 苏一耘 0755-83479312 suyiyun_yj@chinastock.com.cn 上海浦东新区富城路99号震旦大厦31层 上海地区: 陆韵如 021-60387901 luyunru_yj@chinastock.com.cn 李洋洋 021-20252671 liyangyang_yj@chinastock.com.cn 北京市丰台区西营街8号院1号楼青海金融大厦 北京地区: 田薇 010-80927721 tianwei@chinastock.com.cn 唐嫚羚 010-80927722 tangmanling_bj@chinastock.com.cn 公司网址:www.chinastock.com.cn 请务必阅读正文最后的中国银河证券股份有限公司免责声明。 2