您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[东方证券]:Kimi、阶跃星辰等大模型发展有望持续拉动算力需求 - 发现报告
当前位置:首页/行业研究/报告详情/

Kimi、阶跃星辰等大模型发展有望持续拉动算力需求

信息技术2024-03-24浦俊懿、陈超东方证券小***
Kimi、阶跃星辰等大模型发展有望持续拉动算力需求

行业研究|动态跟踪 看好(维持) Kimi、阶跃星辰等大模型发展有望持续拉动算力需求 计算机行业 国家/地区中国 行业计算机行业 报告发布日期InvalidDate 核心观点 Kimi流量持续高增,月之暗面五次扩容Kimi网站仍宕机。随着大模型流量的高增以及长文本上下文长度的提升,算力需求有望持续提升。本周Kimi宣布支持200万字超长无损上下文引发关注,其访问量、app端的下载量及日活用数皆很可观。3月 21日下午,Kimi的APP、小程序以及网页版均显示无法正常使用。公司表示自3 月20日观测到流量异常高增后,已经进行了5此扩容工作,而推理资源会持续配合进行扩容,以承载持续增长的用户量。同时,百度、阿里纷纷准备开放长文本能 力。随着大模型流量的高增以及长文本上下文长度的提升,算力需求有望持续提升。 阶跃星辰发布Step-2万亿参数MoE语言大模型预览版,万亿参数模型对算力提出极高要求。3月23日,阶跃星辰发布Step系列通用大模型,包括Step-1千亿参数 语言大模型、Step-1V千亿参数多模态大模型,以及Step-2万亿参数MoE语言大模型的预览版,提供API接口给其部分合作伙伴试用。据阶跃星辰,万亿参数大模型至少需要等效A800万卡单一集群和高效稳定的训练。我们认为,随着阶跃星辰等大模型顺着Scalinglaw在万亿参数及多模态大模型中的不断攀升,算力需求有望进一步提升。 上海发布2024-2025算力浦江计划,设立智算规模及智算国产化等目标。3月21 日,上海十一部门联合印发《上海市智能算力基础设施高质量发展“算力浦江”智 算行动实施方案(2024-2025年)》。该方案设立多个智算建设目标:到2025年,上海智能算力规模超过30EFlops,占比达到总算力的50%以上;新建智算国产算力 浦俊懿021-63325888*6106 pujunyi@orientsec.com.cn 执业证书编号:S0860514050004 陈超021-63325888*3144 chenchao3@orientsec.com.cn 执业证书编号:S0860521050002 覃俊宁qinjunning@orientsec.com.cn 宋鑫宇songxinyu@orientsec.com.cn 芯片占比超50%等。政府持续积极推动智算建设与算力国产化,国产算力条线值得关注。 随着Kimi等大模型访问量持续高增、长文本长度提升、模型参数以及训练token数量提升,推理算力以及训练算力的需求有望持续提升。在算力的浪潮中,算力国产化是长期趋势。我们认为,算力需求有望持续提升。随着以Kimi为首的大模型的 火爆,访问量等持续高增,各家推理算力的扩容势在必行。另外,随着长文本上下文长度的提升,算力的消耗也必将提升。而随着Kimi等大模型的不断迭代升级,模型参数量以及训练数据量皆有望持续提升,Scalinglaw将持续发挥作用,拉动算力需求。国产AI芯片厂商、国产AI芯片条线及英伟达条线服务器厂商、算力租赁、IDC、服务器运维等算力服务商皆有望持续获益。 投资建议与投资标的 国产算力:建议关注海光信息(688041,买入)、寒武纪-U(688256,未评级)、高新发展(000628,未评级)、神州数码(000034,未评级)、烽火通信(600498,未评 级)、软通动力(301236,未评级)、广电运通(002152,买入)等 英伟达算力链:建议关注浪潮信息(000977,未评级)、紫光股份(000938,买入)等 算力服务提供方:建议关注云赛智联(600602,未评级)、润泽科技(300442,未评级)、亚康股份(301085,未评级)、优刻得-W(688158,未评级)、首都在线(300846,未评级)、深桑达A(000032,未评级)、铜牛信息(300895,未评级)、华铁应急(603300,买入)等 风险提示 AI大模型相关产业发展不及预期风险;算力相关政策落地不及预期风险;算力发展不及预期风险。 阶跃星辰发布万亿参数MoE模型,大模型 混战进入新阶段 Kimi支持200万字上下文,AI应用有望加速落地 2024-03-23 2024-03-22 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 目录 一、国内大模型进展快速,算力需求有望进一步提升4 1.1Kimi火爆,五次扩容网站仍过载停工,算力需求有望进一步提升4 1.2阶跃星辰发布万亿参数大模型预览版,拉动算力需求提升5 二、上海11部门联合印发“算力浦江”方案,设立智算规模以及智算国产化目标7 三、产业政策齐发力,算力条线值得关注8 投资建议与投资标的8 风险提示8 图表目录 图1:Kimi支持200万字上下文4 图2:本周Kimiapp进入appstore免费版前五名4 图3:月之暗面针对网站异常进行说明——已扩容五次,会持续扩容。4 图4:通义千问免费开放1000万字长文档处理功能5 图5:大模型长文本的“不可能三角”5 图6:阶跃星辰携手云赛智联等持股上海智能算力科技有限公司6 图7:上海智能算力科技有限公司进行国产化算力设备招标6 图8:上海市通信管理局等11个部门联合印发《上海市智能算力基础设施高质量发展“算力浦江” 智算行动实施方案(2024-2025年)》7 图9:算力浦江设立智算规模目标以及国产化芯片占比目标7 一、国内大模型进展快速,算力需求有望进一步提升 1.1Kimi火爆,五次扩容网站仍过载停工,算力需求有望进一步提升 Kimi爆火,访问量、app端的下载量及日活用数可观。本周,月之暗面宣布Kimi已可以支持200万字超长无损上下文,该智能助手主要有“长文总结和生成、联网搜索、数据处理、编写代码、用户交互、翻译”等6项功能。近期,Kimi持续火爆,访问量、app端的下载量以及日活用数都非常客观。根据“AI产品榜aicpb.com”的统计数据,2024年2月Kimi智能助手的访问量305万,在大模型创业公司的“AIChatBots”产品中排在第一;月环比增长达107.6%。另外,Kimi 目前的日活用户数已达100万人。其APP一度冲进appstore免费app排行前五。 图1:Kimi支持200万字上下文图2:本周Kimiapp进入appstore免费版前五名 数据来源:Kimi、量子位、东方证券研究所数据来源:量子位、东方证券研究所 Kimi由于流量高增宕机,月之暗面表示已进行五次扩容,并将持续对推理资源进行扩容。3月21 日下午,Kimi的APP、小程序以及网页版均显示无法正常使用。月之暗面针对相关情况发布说明:“从3月20日9点30分开始,观测到Kimi的系统流量持续异常增高,流量增加的趋势远超对资源的预期规划。这导致了从20日10点开始,有较多的SaaS客户持续的体验到429:engineisoverloaded的异常问题,并对此表示深表抱歉。”公司表示自3月20日观测到流量异常高增后,已经进行了5此扩容工作,而推理资源会持续配合进行扩容,以承载持续增长的用户量。 图3:月之暗面针对网站异常进行说明——已扩容五次,会持续扩容。 数据来源:每日经济新闻、东方证券研究所 百度、阿里纷纷准备开放长文本能力。随着Kimi的火爆,多家大模型厂商纷纷官宣开放自家长文本能力。其中,3月22日,据科创版日报,百度文心一言下个月将进行版本升级,届时也将开放长文本能力,文字范围会在200万-500万。同一天,阿里宣布通义千问大模型迎来重磅升级,将向所有人免费开放1000万字的长文档处理功能,成为全球文档处理容量第一的AI应用。 图4:通义千问免费开放1000万字长文档处理功能 数据来源:通义千问官网、东方证券研究所 大模型上下文长度拓展存在“不可能三角”:文本长度、注意力和算力。Transformer架构依赖于自注意力机制来处理输入序列。随着序列长度的增加,自注意力层的计算复杂度呈二次方增长, 其中n是序列长度。这意味着对于较长的序列,模型需要进行大量的计算,这也对算力提出了更高的要求,从两个方面共同限制了大模型上下文长度的无限拓展。上下文文本越长,模型越难聚焦充分注意力,难以完整理解用户意图;注意力限制下,短文本无法完整解读复杂信息;处理长文本需要大量算力,从而提高了成本。按GPT-4Turbo目前API的输入输出价格来计算,要用满128k的长度进行一次输入输出的话,一次问答的价格超过30元。 图5:大模型长文本的“不可能三角” 数据来源:东方证券研究所绘制 1.2阶跃星辰发布万亿参数大模型预览版,拉动算力需求提升 阶跃星辰发布Step-2万亿参数MoE语言大模型预览版,万亿参数模型对算力提出极高要求。2024年3月23日,阶跃星辰发布Step系列通用大模型,包括Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型,以及Step-2万亿参数MoE语言大模型的预览版,提供API接口给其部分合作伙伴试用。阶跃星辰顺着Scalinglaw持续攀登,在万亿参数和多模态的新战场 中持续演进。据阶跃星辰,万亿参数大模型至少需要等效A800万卡单一集群,高效稳定的训练,以及十万亿tokens高质量的数据。 阶跃星辰具有算力储备、且具有万卡集群建设管理能力。公司携手云赛智联、上海仪电等上海国资企业,成立智能算力子公司。阶跃星辰具备打造万亿参数模型的坚实基础。公司通过自建机房 +租用算力,积极进行算力储备;核心团队曾实践过单集群万卡以上的系统建设与管理。训练千亿模型的MFU(有效算力输出)达57%。同时,阶跃星辰与上海仪电、云赛智联等主体参股上海智能算力科技有限公司,积极进行智算储备。据公开招标,上海智能算力科技有限公司于2023 年11月进行招标,针对智算集群一期的项目采购一体化智算集群平台、智算集群平台迭代开发以及智算集群平台建设及运维管理系统。其中,招标文件表示一体化智算集群平台需满足一万张GPU卡和两千颗CPU的智能调度能力。 图6:阶跃星辰携手云赛智联等持股上海智能算力科技有限公司 数据来源:wind、东方证券研究所绘制 图7:上海智能算力科技有限公司进行国产化算力设备招标 数据来源:wind、东方证券研究所 二、上海11部门联合印发“算力浦江”方案,设立智算规模以及智算国产化目标 3月21日,上海发布2024-2025算力浦江计划,设立多个目标。3月21日,上海市通信管理局会同市委网信办、市发展改革委、市数据局等十一部门研究制定了《上海市智能算力基础设施高质量发展“算力浦江”智算行动实施方案(2024-2025年)》。该方案设立了一系列建设目标,要求形成上海算力交易平台、上海市人工智能公共算力服务平台两大算力资源调度核心,以及面向智算应用的算力中心多极分布的“1+1+X”智能算力建设和服务体系。 图8:上海市通信管理局等11个部门联合印发《上海市智能算力基础设施高质量发展“算力浦江”智算行动实施方案(2024-2025年)》 数据来源:上海通信圈、东方证券研究所 该方案设立2025年上海智算规模30EFLOPS,新建智算国产算力芯片占比超50%等目标。该方案分别针对智能算力规模、智算国产化、智算应用融合、绿色智算以及智算安全分别提出切实可 行的目标。 智算设施目标:到2025年,上海智能算力规模超过30EFlops,占比达到总算力的50%以上。算力网络节点间单向网络时延控制在1毫秒以内。智算中心内先进存储容量占比达到50%以上。 智算自主可控:到2025年,上海新建智算中心国产算力芯片使用占比超过50%,国产存储使用占比超过50%,服务具有国际影响力的通用及垂直行业大模型设计应用企业超过10家。 智算应用融合:到2025年,上海具备大规模应用赋能价值的智算中心数量达到10家。智能算力典型应用场景超过50个。争取5个以上