证 券 研2024年07月07日 究 报商汤发布流式多模态大模型日日新5.5,国内首 告次全面对标GPT-4o 推荐(维持)投资要点 —计算机行业周报 分析师:宝幼琛S1050521110002baoyc@cfsc.com.cn 行业相对表现 表现 1M 3M 12M 计算机(申万) -4.5 -16.2 -36.1 沪深300 -4.0 -3.8 -10.3 市场表现 (%)计算机沪深300 10 0 -10 -20 -30 -40 -50 资料来源:Wind,华鑫证券研究 1、《计算机行业周报:首款 Transformer专用芯片Sohu亮相, 10倍于B200速度成为最快AI芯片》2024-06-30 2、《计算机行业周报:华为HarmonyOSNEXT强势亮相,“纯血鸿蒙”有望重塑AI操作系统市场格局》2024-06-23 3、《计算机行业周报:AMD公布MI325X同台竞技英伟达,“年更”预示AI芯片竞争趋于白热化》2024-06-16 相关研究 行业研究 ▌算力:算力租赁价格平稳,国产GPU万卡集群夸娥重磅发布 本周算力租赁价格环比持平。在产业动态方面,7月3日,摩尔线程在上海重磅宣布其AI旗舰产品夸娥(KUAE)智算集群解决方案实现重大升级,从当前的千卡级别大幅扩展至万卡规模。夸娥万卡智算解决方案拥有多个核心特性:单集群规模超万卡,浮点运算能力达10Exa-Flops,GPU显存总容量达PB级,卡间互联总带宽和节点互联总带宽也达每秒PB级,实现算力、显存和带宽的系统性协同优化;具有超高稳定性能,月级长稳训练,夸娥万卡集群平均无故障运行时间超15天,最长可实现大模型稳定训练30天以上,周均训练有效率在99%以上;MFU最高可达60%,通过系统软件、框架、算法等层面的一系列优化实现高效率训练;全能通用的生态友好平台,计算能力为通用场景设计,可加速不同架构、不同模态的大模型,基于MUSA编程语言、兼容CUDA能力和自动化迁移工具Musify,加速新模型迁移,实现生态适配“InstantOn”。夸娥成为业内首个成功跑通并完整运行国产大模型的集群。 ▌AI应用:商汤科技发布日日新5.5大模型,国内首次全面对标GPT-4o 7月5日,商汤科技正式于WAIC大会上推出日日新5.5,以及可以进行流式多模态交互的5o版本,实现跨文本,音频,图像与视频推理。在MMBv1.1、MMStar、MathVista、AI2D、OCRBench等多项全球权威测评中,日日新5.5的得分均超过GPT-4o。在语言和知识、推理数理、编程、考试五大能力测试中,日日新5.5相比日日新5.0实现较大升 级。据测评,日日新5.5在英文能力、指令跟随、长文本理解、 Function能力等方面大大提升,整体性能提升30%。 新模型日日新5o拥有实时语音视频交互功能,能够在用户要求要识别出图像内容,多轮对话流畅丝滑。同时,商汤推出了可控人物类AI视频生成产品Vimi,可稳定生成长达1分钟的单镜头人物类视频,具有高动态,高保真特点,预计本月内公测。 ▌AI融资动向:FormationBio获D轮融资额3.72 亿美元 本期AI初创公司的融资中,FormationBio/Sentient融资额前二,分别为3.72亿/0.85亿美元。EvolutionaryScale是一家技术驱动和人工智能原生制药公司,致力于加速药物开发和临床试验的各个方面,计划利用这笔新资金,继续从生物技术和制药合作伙伴那里收购和授权临床阶段资产。Sentient旨在通过Polygon利用区块链技术,构建一个社区驱动的开放式AGI平台,其使命是实现人工智能开发的民主化,确保人工智能造福全人类,这笔资金将加速开源人工智能模型的开发,并为专业模型实现高效、可信的分发提供途径。 ▌投资建议 商汤发布首个面向C端的可控人物视频生成大模型Vimi,国产大模型多模态能力进一步提升。目前,行业里80%的视频都是以人物为主要内容,Vimi填补了市场上可控人物视频生成的AIGC产品的空缺,市场空间广阔。除了商汤外,蚂蚁百灵大模型等大模型多模态能力也持续进步。在生活服务上,蚂蚁集团使用多模态模型实现了ACT技术,让智能体具备一定规划执行能力,比如根据用户语音指定直接在星巴克小程序下单一杯咖啡,目前这一功能已在支付宝智能助理上线。在医疗领域,多模态能力为用户实现复杂任务的操作,可以对超过100多种复杂的医学检验检测报告进行识别和解读,还可以检测毛发健康和脱发情况,对治疗提供辅助。原生多模态被认为是通往AGI的必经之路,多模态大模型技术能够使AI更好地理解人类世界的复杂信息,也让AI落地应用时更符合人类的交互习惯,在智能客服、自动驾驶、医疗诊断等多个领域展现出巨大的应用潜力。 硬件端,全球前四大云服务商资本支出仍在调升,预计从2023年的 1400亿美元提升至2024年的逾2000亿美元,全球AI产业仍在狂飙式发展。 建议关注关注以AI为核心的龙头厂商科大讯飞(002230.SZ)、有望迎来需求爆发的AI应用金桥信息(603918.SH)、高速通信连接器业务或显著受益于GB200放量的鼎通科技(688668.SH)。 ▌风险提示 1)AI底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI应用落地效果不及预期。4)推荐公司业绩不及预期风险。 股价 2023 2024E 2025E 2023 2024E 2025E 002230.SZ科大讯飞 41.20 0.28 0.40 0.56 147.14 103.00 73.57 买入 002368.SZ太极股份 21.70 0.79 1.01 1.28 27.47 21.49 16.95 买入 603918.SH金桥信息 11.44 0.33 0.49 0.80 34.67 23.35 14.30 买入 688668.SH鼎通科技 38.93 0.67 1.04 1.41 58.10 37.43 27.61 买入 2024-07-07 EPS PE 公司代码 名称 投资评级 资料来源:Wind,华鑫证券研究 正文目录 1、算力动态:算力租赁价格平稳,国产GPU万卡集群夸娥重磅发布5 1.1、数据跟踪:算力租赁价格平稳5 1.2、产业动态:摩尔线程推出夸娥(KUAE)智算集群解决方案,算力规模达万卡万P5 2、AI应用动态:商汤科技发布日日新5.5大模型,国内首次全面对标GPT-4O8 2.1、流量跟踪:NotionAI访问量环比+2.26%8 2.2、产业动态:商汤科技发布日日新5.5大模型,国内首次全面对标GPT-4o9 3、AI融资动向:FORMATIONBIO获D轮融资额3.72亿美元11 4、行情复盘12 5、投资建议14 6、风险提示15 图表目录 图表1:本周算力租赁情况5 图表2:夸娥(KUAE)国产全功能GPU智算集群5 图表3:夸娥(KUAE)全栈解决方案架构6 图表4:夸娥(KUAE)核心能力6 图表5:夸娥(KUAE)单点超大算力实现万卡万P6 图表6:夸娥(KUAE)超长稳定实现月级长稳训练7 图表7:夸娥(KUAE)实现分布式并行计算优化7 图表8:夸娥(KUAE)计算能力为通用场景设计8 图表9:夸娥(KUAE)完整兼容CUDA倍数级加速生态迁移8 图表10:2024.6.26-2024.6.30AI相关网站流量9 图表11:日日新5.5多模态核心指标更新对比9 图表12:日日新5.5核心指标更新10 图表13:日日新端侧模型5.5更新10 图表14:Vimi生成人物视频展示10 图表15:本周AI初创公司的融资动态11 图表16:本周指数日涨跌幅12 图表17:本周AI算力指数内部涨跌幅度排名13 图表18:本周AI应用指数内部涨跌幅度排名13 图表19:重点关注公司及盈利预测15 1、算力动态:算力租赁价格平稳,国产GPU 万卡集群夸娥重磅发布 1.1、数据跟踪:算力租赁价格平稳 本周算力租赁价格环比持平。具体来看,显卡配置为A100-40G中,腾讯云16核+96G价格为28.64元/时,阿里云12核+94GiB价格为31.58元/时;显卡配置为A100-80G中,恒源云13核+128G价格为8.50元/时;阿里云16核+125GiB价格为34.74元/时;显卡配置为A800-80G中,恒源云16+256G的租赁较为紧张。 图表1:本周算力租赁情况 显卡配 置 CPU 内存磁盘大小(G) 平台名称 价格(每 小时) 价格环比上周 A100-40G1696可自定,额外收费腾讯云28.64/元0.00%12核94G可自定,额外收费阿里云31.58/元0.00% A100-80G 13128系统盘:20G数据盘:50GB 恒源云8.50/元0.00% 16核125G可自定,额外收费阿里云34.74/元0.00% A800-80G16256系统盘:20G 数据盘:50GB 资料来源:腾讯云,阿里云,恒源云,华鑫证券研究 恒源云-- 1.2、产业动态:摩尔线程推出夸娥(KUAE)智算集群解决方案,算力规模达万卡万P 7月3日,摩尔线程在上海重磅宣布其AI旗舰产品夸娥(KUAE)智算集群解决方案实现重大升级,从当前的千卡级别大幅扩展至万卡规模。摩尔线程夸娥(KUAE)万卡智算集群,以全功能GPU为底座,包括以夸娥计算集群为核心的基础设施、夸娥集群管理平台 (KUAEPlatform)以及夸娥大模型服务平台(KUAEModelStudio),旨在打造国内领先的、能够承载万卡规模、具备万P级浮点运算能力的国产通用加速计算平台,专为万亿参数级别的复杂大模型训练而设计,树立了国产GPU技术新标杆。 图表2:夸娥(KUAE)国产全功能GPU智算集群 资料来源:摩尔线程官网,华鑫证券研究 图表3:夸娥(KUAE)全栈解决方案架构图表4:夸娥(KUAE)核心能力 资料来源:摩尔线程官网,华鑫证券研究资料来源:摩尔线程官网,华鑫证券研究 单集群计算超万卡万P,算力阶跃式提升。在集群计算能力方面,全新一代夸娥智算集群实现单集群规模超万卡,浮点运算能力达到10Exa-Flops,大幅提升单集群计算性能,能过够为万亿参数级别大模型训练提供坚实算力基础。在GPU显存和传输带宽方面,夸娥万卡集群达到PB级的超大显存容量、每秒PB级的超高速卡间互联总带宽和每秒PB级超高速节点互联总带宽,实现算力、显存和带宽的系统性协同优化,全面提升集群计算性能。 图表5:夸娥(KUAE)单点超大算力实现万卡万P 资料来源:机器之心,华鑫证券研究 超长稳定实现月级长稳训练。在集群稳定性方面,夸娥万卡集群平均无故障运行时间超15天,最长可实现大模型稳定训练30天以上,周训练有效目标最高可达99%以上,远超行业平均水平。夸娥超高集群稳定性的背后,是摩尔线程自主研发的一系列可预测、可诊断的多级可靠机制,包括:软硬件故障的自动定位与诊断预测实现分钟级的故障定位,Checkpoint多级储存机制实现内存秒级储存和训练任务分钟级恢复以及高容错高效能万卡集群管理平台实现秒级纳管分配与作业调度。 图表6:夸娥(KUAE)超长稳定实现月级长稳训练 资料来源:机器之心,华鑫证券研究 分布式并行计算极致优化,实现超高MFU。夸娥万卡集群在系统软件、框架、算法等层面进行了一系列优化,有效计算效率(MFU)目标最高达60%,可达到国际水平。在系统软件层面,基于极致的计算和通讯效率优化等技术手段,大幅提升集群的执行效率和性能表现。在框架和算法层面,夸娥万卡集群支持多种自适应混合并行策略与高效显存优化等,可以根据应用负载选择并自动配置最优的并行策略,大幅提升训练效率和显存利用。同时,针对超长序列大模型,夸娥万卡集群通过CP并行、RingAttention等优化技术,有效缩减计算时间和显存占用,大幅提升集群训练效率。 图表7:夸娥(KUAE)实现分布式并行计算优化 资料来源:机器之心,华鑫证券研