您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华西证券]:计算机行业策略报告:国产AI,崛起与重估 - 发现报告

计算机行业策略报告:国产AI,崛起与重估

信息技术2025-03-07华西证券浮***
AI智能总结
查看更多
计算机行业策略报告:国产AI,崛起与重估

华西计算机团队刘泽晶 SAC NO:S1120520020002赵宇阳SACNO:S1120523070006孟令儒奇SACNO:S1120524060001 核心观点 >DeepSeek激活国产Al产业链 一、Deepseek拉通模型开源之路二、低成本高效果、刺滚下游应用需求爆发 中国科技股估值进入重估时刻 一、打破国外闭源模型断,AI格局有望重新洗牌二、国内巨头竞赛AICapex,景气度拉爆 >AI+应用全面普及 一"、AlAgent有望全面幅起二、A1终端25年将迎来井喷式增长 →受益标的: ◆AIAgent应用:金山办公、用友络、金桥信息、润达医疗、合合信息、开等云、新致软件、润和较件、微盟集团、彩凯股份、汉得信息、拓尔思、同花顺、鼎捷数智、亚信安全、万兴科技,宇信科技、京北方、高伟达等; →A终端:乐鑫料技、恒玄科技、润欣科技、中科蓝讯、朝捷科技,云天励飞→国产算力:中芯国际、海光信息、寒武纪、中科曙光、长光华芯,弘信电子、神州教码→算力云&一体机:首部在线、优刻得、深信服、云从科技、深柔达、云寒智联、太极股份、亚信科技、网宿科技机器人产业链:祥鑫科技、杂安股份、奥比中光、交迪科技、能科科技、虹软科技、上海机电 >风险提示:市场光争加剧:严品研友不及预期 目录 01Deepseek激活国产Al全产业链03AI+应用全面崛起 投资建议与风险提示 科技突围洞见AI新纪元华西证券2025年春季投资策略会 01Deepseek激活国产AI全产业链 科技突围洞见AI新纪元华西证券2025年春季投资策略会 1.1各大平台接入满血DeepSeek 各大平台接入DeepSeek-R1:随希DeepSeekR1模型的强大推理能力和开源特性,众多国内外平台纷纷接入DeepSeekR1671B满血点。不仅仅各个大厂都宝布接入了DepSk满血版本,社交国民软件微信也在搜一搜里植入了DeupSetk大模型。DeepSeek生态加速进行时! 1.2从规模效应到性价比,DeepSeek打开天花板 DeepSeek-Rl:首个开源、烷美OpenAIol的推理大模型。DeepSeek-R1展现出了与OperATo1相当甚至在某些方面更优的性能。在MATH基准测试上,R1达到了77.5%的准确率,与01的77.3%相近:在更具据战性的AIME2024上,R1的准确率达到71.3%,超过了ol的71.0%。在代码领域,R1在Cndefnrr:评测中达到了2441分的水平,高于96.3%的人类参与者。 从规模效应到性价比,DeepSeek打开天花板:R1模型在技术上实现了重要突碳一用纯深度学习的方法让AI自发涌现出推理能力,在数学、代码、自然语言推理等任务上,性能比肩关国开放人工智能研完中心(OFenAI)的1模型正式版,该模型同时延续了该公司高性价比的优势。据中国卡年报,深度求索公司R1模型训练成本仅为560万关元,远远低子美国开放人工智能研究中心、谷款、“元”公司等美国科技巨头在人工智能技术上投入的数亿关元乃至数十亿关元。根摄新智元援引外媒报道,他们在短短两个月时间,在2048个H800GPU集群上,训出6710亿参数的MoE语言模型,比顶尖A1效率高出10倍。 DeepSeek-R1官方回应成本:加果所有Iaken全部按照TDeerSeekR1的定价计算,理论上--天的总收入为S562.027,成本利润率545%。但实际上没有这么多收入,固为V3的定价更低,同时收费服务只占了一部分,另外夜间还会有折扣。另外,每个H800节点实现了73.7k/14.8k个每秒输入/输出Lnken;(理论)成本利润率高达545%: DeepSeek采用了跨节点专家并行(EP,ExpertParallelism)策略:EP的系统复杂性体玩在:EP引入了跨节点通信。为了凭化吞吐量,必须设计适当的计算工作流,shi通信与计算重叠。EP涉及多个节点,因此本质上需要数据并行(IDP),并且需要在不同的IDP实例之间进行负载平衡。 DeepSeek-V3/R1推理服务均在H800GPU上运行:具体而言,矩阵乘法和分发传输采用与训续一致的FP8格式,而核心MIA计算和组合传输使用BFI6格式,确保最佳服务性能。V3和RI推理业务的合并峰使节点占用达到278平均占用226.75个节点(每个节点包含8个H800GPU)。假设租货一个H800GPU的成本为年小时2关元,年日总成本为87,072关元(约合人民币63.4万)。 1.3国产算力异军突起,充分受益国产模型deepseek崛起 据华为云2月1日消息,DeepSeek-R1开源后引发全球用户和开发者关注。经过硅基流动和华为云团连日攻坚,现在,双方联合首发并上线基于华为云并腾云服务的IeepSeekR1/V3非理服务。据华为云消息,该服务其备以下特点:1)得益于自研推理加逻引等加持,硅基流动和华为云异腾云服务支持部署的DeepSeek模型可获得持平全球高端Gl部署模型的效采。2)提供稳定的、生产级服务能力,让模型能够在大规模生产环境中稳定选行,并满足业务商用部署需求。华为云开腾云服务可以捉供澎湃、弹性、充足的算力。 国产算力厂商纷纷拥抱DeepSeek:根据光合组织消息:近日,海光信息技术团队成功完成DeepSeekv3和R1模型与海光CU(深度计算单元)的国产化造配,并正式上线。根据彭博消息,据苏州发布,苏州数智科技集团近日在苏州市公共算力服务平台上架了基于英伟达算力部署的DeepSeck-R1模型和基于华为腾算力部署的DeepSeek-v3模型。同时提供基于DpSk族型的-一体机,针对有本地化部署需求的月户提供开箱对用的软硬件-一体服务。无锡太湖亿芯智算中心正式投入运营,目前已上线基于递原科技算力的IeepSeek全系列开源模型推理服务。2月9日,由无锡数据集团速设运营的无锡“算力超市”(无锡算力公共服务平台)也正式上线Depek大模型,实现了本池化部署和调用。 我们判断异博910C在国产化推理时代更具性价比:根据快科技,华为异尊910C在A1推理中的表现出乎意补地好,已经达到NVIDIAH100芯片的60%左左。更进一步地,通过手写CUNN内核和优化,并感910C的性能还可以进-步提升。据称,DeepSeek从第一天起就支持华为异腾芯片,并且自主维护PyTorch仓库,只需一行代码就能将CUDA转换为CUNN,性能优化的游力也相当巨大,通过定制优化可达到更高性能。 华为已经发布Atlas全新集群支持超万亿参数大模型训练:在华为全联接大会2023上,华为排出全新架构的并腾AI计算集群-Atlas900SuperCluster。新集群采用了全新的华为星河Al智算交接机CloudEngineXH16800,借助其高密的800GE端口能方,两层交换网终即可实现2250节点(等效于1.8万张卡)超大规模无收效集群组网。其优势显著,新集群同时使用了创新的超节点架构,大大提升了大模型训练能力实现算力的资源统一调度,采用液冷设计。 1.4推理时代来临,互联网厂商有望上调Capex DeepSeek主打极致性价比,推理商业模式形成闭环:DeepSeek-V3API服务的45天优惠价格体验期已结束,从2月9日开始将调整为新的价格:每百万输入tokens0.5元(缓存命中)/2元(缓存末命中),每百万输出tokens8元。此前DeepSeek在优惠期内APl价格为每百万输入tokenso.1元(缓存命宁)/1元(缓存末未命中),每百万输出tokens2元。我们判断DeepSeek份格较低,其性价比较高,推理商业模式形成阅环。 互联网厂商全面拥抱DeepSeek:2月11日,火山引擎智能算法负责人吴迪、火山方舟产品经理安清等,将图绕多元模型部署调月、火山方舟上API调用DeepSeekR1、火山引擎部署DeepSeek方案、DeepSeek平台上开发Al应月等开晨研讨二是道达自有三方模型,以实现道建边辞大模型网关签发的网关访问密钥进行对应模型的访问与调月。目前,我们判断在字节跳动布局Al终端,玩具、耳机,眼镜、手机打开全断市场的背景下,DeepSeek的出现如虎添翼,推理时代已经到未,其资本开支有望上升。 百度部署DeepSeek:2月3日晓间,百度智能云宝布,百度智能云千帆平台已正式上架DeepSeek-R1和DeepSeek-V3模型,推出了超低价格方素,还可享受限时免费服务,登录百度智能云千帆ModelBuildar即可快逸体验。比次接入的模型已全面融合千帆推理链路,集成百度独家内容安全算子,实现模型安全增强与企业级高可月保障,助力月户安全、稳定池构建智能应用。 阿里宣布云上部署DeepSeek,同时宣布与苹果合作:同样在2月3日,阿云也宣布,阿云PAIModelGallery支持云上一键部署DeepSeek-V3、DeepSeek-R1。在该平台上,月户可以零代码实现从训练到部署再到非理的全过程体验。此外,阿里巴巴联合创始人,董事局主席蔡崇信回应阿里与革果合作,苯果与矿里达成AI合作。 讯云「HAI」上,开发者仅需3分钟就能接入调用。此外,根据现察者同,2月15印晚间,微信披一楼在测试接入DeepSeek-R1。腾讯关人士回应称,微信披一披在调月混元大模型车富Al搜索的同时,近日正式灰度测试接入DeepSeek. 1.5DeepSeek崛起,国产生态持续繁荣 DaepSaek通过大量细趋度优化以及使用英伟达的类汇端级别的PTX(并行级程执行)编程,在训练V3模型对,DeepSeek对英伟达HB00GPU选行了重新配置:为了最大化性能,DeepSeek还通过额外的细益度线程/缓程束级别调整,实现了先进的流水缓算法。我们判断这种方法并没有完全绕过Cuda生态,而是通过RTX的方法自我编泽,不具备通用性,但是这种级别的优化冷恰充分展现DeepSeek团从的车越技术实力。 月,CANN3.0放本发布,作为专门面向AI场景的异构计算架构,搭起了上层深度学习框架和底层AI硬件平台的桥渠,目前华为CANN计算平台已经到了8.0.0.a|pha003版本,其生态加速繁荣,释放界脖AI大算方使能大模型极简开发,华为界腾已实现生态较为全再兼容,算子半富度进--少提高,CANN全雷录容业界融合算子、AI栏架、加造举和主流大模型;可助力模型的极改加速,资源灵活调度、算子深度缺会、计算高度并行,大模型性能深度优化 1.6三大运营商接入DeepSeek,国产AI生态加速 中国电信,全场景覆盖,打造智能化服务:中回电信天翼云全场景上案了DeepSeek,为用户提供了更使捷、更高效的智能服务,根据C114网,去年中国电信招标的载据统计,标包共计13个,标包6报标失改外,芳外标包总计168亿元,本次焦采预估采购款量为15.6万台。经C114简单计算,G系列,也就是国产化系列数量达到10.53万台,占比达到67.5%.我们列断术来随着DeepSeek国产模型的持续突破后,国产化AI有望持换加建,国产化服务器份额有望持续增加, 中国联通,深庭对接,推动AI技术善惠:中国联通实布,联通云已基于“星罗“平台实现回产及主流算力法配多规格DeepSeek-R1模型兼顾私有化和公有化场景,实现多产品场景调用,根据C114网消息,2024年4月26日,中国联通日晚间公示了2024年人工智能服务器公开集采的结采,该项目平均中标价约为201600万元,因产云与应产4I服务器有望持续加速。 中国移动,全面上线,实现全功能畅用:国移动移动云布全面上线DeepSek,实现全瓶本覆益、全尺十造配、全功能惨用。用户可违择生一智算资源池违行部案,蒸储,智能体编排等择作。机据C114网消息,2024年5月16日,中再移动公示2024-2025年新型智算中心集采中标结果,总金部约191亿元,我们判断今年国产A有望持续加追, 1.7云服务公司联合DeepSeek,本地化部署带动-一体机 DeepSeek发布后