幻方开源DeepSeek-V2,大模型成本取得重大突破。2024年5月6日, 幻方量化旗下的AI公司深度求索发布全新第二代MoE大模型 DeepSeek-V2,在目前大模型主流榜单中表现出色:中文综合能力开源模型 中最强;英文综合能力与最强的开源模型LLaMA3-70B同处第一梯队。 DeepSeek-V2 API的定价为每百万tokens输入1元、输出2元(32K上下 文),价格仅为GPT-4-Turbo的近百分之一。DeepSeek-V2对模型框架进 行了全方位的创新,提出了MLA(Multi-head Latent Attention)架构,大幅 减少计算量和推理显存;自研Sparse结构DeepSeekMoE进一步降低计算 量,两者结合最终实现模型性能跨级别的提升。 月之暗面更新Kimi+,打造专业私人助理。2024年5月6日,月之暗面旗 下kimi智能助手迎来大更新推出Kimi+,Kimi+是更专业的小助手,是拥有 独特技能的Kimi分身,可以解决特定问题,也可以组成AI生产线。在产品 设计上,OpenAI推出的GPTs需要用户预先选择好指定的GPTs再进行对话, 相比之下Kimi+可以在kimi的聊天窗口中通过@对应kimi+的方式直接唤 起,我们认为这种交互方式可以极大改善用户体验。 商汤日日新SenseNova 5.0全面对标GPT-4 Turbo。2024年4月23日, 商汤科技全新升级6000亿参数的“日日新SenseNova 5.0”大模型,具备 更强的知识、数学、推理及代码能力,综合性能全面对标GPT-4 Turbo,并 在主流客观评测上达到或超越GPT-4Turbo。“日日新5.0”的文生图能力 也有较大提升。在人物生成上和不同字段的理解合成上表现出优秀效果。我 们认为,近期国产大模型持续取得突破性进展,模型能力的进步将利好AI 应用的快速发展。 建议关注:1)算力侧:浪潮信息、寒武纪、海光信息、中科曙光、利通电 子、中际旭创、新易盛、工业富联、拓尔思、高新发展、神州数码、软通动 力、协创数据、润建股份、万马科技、云赛智联、烽火通信等。2)AI相关: 金山办公、虹软科技、大华股份、海康威视、润达医疗、昆仑万维、拓尔思、 中广天择、同花顺、科大讯飞、润达医疗、漫步者、万兴科技等。3)自动 驾驶:赛力斯、江淮汽车、长安汽车、德赛西威、中科创达、万马科技、海 天瑞声、北汽蓝谷、菱电电控、华依科技、经纬恒润、东风汽车、光庭信息 等。 风险提示:AI技术迭代不及预期风险;经济下行超预期风险;行业竞争加 剧风险。 幻方开源DeepSeek-V2,大模型成本取得重大突破 2024年5月6日,幻方量化旗下的AI公司深度求索(DeepSeek)发布全新第二代MoE大模型DeepSeek-V2。据幻方官方介绍,DeepSeek-V2能力媲美GPT-4,在目前大模型主流榜单中,DeepSeek-V2均表现出色: 1)中文综合能力(AlignBench)开源模型中最强,与GPT-4-Turbo,文心4.0等闭源模型在评测中处于同一梯队; 2)英文综合能力(MT-Bench)与最强的开源模型LLaMA3-70B同处第一梯队,超过最强MoE开源模型Mixtral 8x22B; 3)知识、数学、推理、编程等榜单结果也位居前列; 4)支持128K上下文窗口。 图表1:各大模型API或Chat版本效果对比 DeepSeek-V2 API的定价为:每百万tokens输入1元、输出2元(32K上下文),价格仅为GPT-4-Turbo的近百分之一。DeepSeek-V2成本低的原因是没有沿用主流的“类LLaMA的Dense结构”和“类Mistral的Sparse结构”,而是对模型框架进行了全方位的创新,提出了MLA(Multi-head Latent Attention)架构,大幅减少计算量和推理显存;自研Sparse结构DeepSeekMoE进一步将计算量降低到极致,两者结合最终实现模型性能跨级别的提升。据幻方官方不严谨估计,DeepSeek-V2以236B总参数、21B激活,大致达到70B~110B Dense的模型能力,同时消耗的显存只有同级别Dense模型的1/5~1/100,每token成本大幅降低。 图表2:部分kimi+示例 月之暗面更新Kimi+,打造专业私人助理 2024年5月6日,月之暗面旗下kimi智能助手迎来大更新推出Kimi+,据月之暗面介绍,Kimi+是更专业的小助手,是拥有独特技能的Kimi分身,可以解决特定问题,也可以组成AI生产线。 图表3:部分kimi+示例 在产品设计上,OpenAI推出的GPTs需要用户预先选择好指定的GPTs再进行对话,相比之下Kimi+可以在kimi的聊天窗口中通过@对应kimi+的方式直接唤起,我们认为这种交互方式可以极大改善用户体验。 图表4:部分kimi+示例 商汤日日新SenseNova 5.0全面对标GPT-4 Turbo 2024年4月23日,商汤科技带来全新升级的“日日新SenseNova 5.0”大模型,(下文简称“日日新5.0”),规模达到6000亿参数,具备更强的知识、数学、推理及代码能力,综合性能全面对标GPT-4 Turbo,并在主流客观评测上达到或超越GPT-4 Turbo。 “日日新5.0”能力提升主要得益于三个方面: 1)采用混合专家架构(MoE),激活少量参数就能完成推理。且推理时上下文窗口达到200K左右。 2)基于超过10TB tokens训练、覆盖数千亿量级的逻辑型合成思维链数据。 3)商汤AI大装置SenseCore算力设施与算法设计的联合调优。 图表5:“日日新5.0”在大部分核心测试集指标上都对标甚至超过GPT-4 Turbo “日日新5.0”的文生图能力也有较大提升。据商汤官方展示的与Midjourney、Stable Diffution3、GPT-4V的对比示例,“日日新5.0”在人物生成上有非常大的提升,秒画生成的人像可以看出非常好皮肤的纹理。在怎样把不同字段的理解合成在一起的能力对比上,秒画给出了一个非常未来感的建筑,且对建筑下的倒影、波浪都表现得非常具有美感,实现了比较完整的指令跟随且生成效果好。 图表6:“日日新5.0”与其他文生图模型对比 我们认为,近期国产大模型持续取得突破性进展,模型能力的进步将利好AI应用的快速发展。继kimi在长文本能力上取得突破后,商汤科技的6000亿参数大模型在性能上全面对标GPT-4 turbo,幻方再次在性能媲美GPT-4的前提下做到了成本的大幅降低,近期海外Meta的Llama3开源模型等产业发展也将驱动AI应用的蓬勃发展。 建议关注 1)算力侧:浪潮信息、寒武纪、海光信息、中科曙光、利通电子、中际旭创、新易盛、工业富联、拓尔思、高新发展、神州数码、软通动力、协创数据、润建股份、万马科技、云赛智联、烽火通信等。 2)AI相关:金山办公、虹软科技、大华股份、海康威视、润达医疗、昆仑万维、拓尔思、中广天择、同花顺、科大讯飞、润达医疗、漫步者、万兴科技等。 3)自动驾驶:赛力斯、江淮汽车、长安汽车、德赛西威、中科创达、万马科技、海天瑞声、北汽蓝谷、菱电电控、华依科技、经纬恒润、东风汽车、光庭信息等。 风险提示 AI技术迭代不及预期风险:若AI技术迭代不及预期,则对产业链相关公司会造成一定不利影响。 经济下行超预期风险:若宏观经济景气度下行,固定资产投资额放缓,影响企业再投资意愿,从而影响消费者消费意愿和产业链生产意愿,对整个行业将会造成不利影响。 行业竞争加剧风险:若相关企业加快技术迭代和应用布局,整体行业竞争程度加剧,将会对目前行业内企业的增长产生威胁。