AI智能总结
核心观点 ⚫Kimi流量持续高增,月之暗面五次扩容Kimi网站仍宕机。随着大模型流量的高增以及长文本上下文长度的提升,算力需求有望持续提升。本周Kimi宣布支持200万字超长无损上下文引发关注,其访问量、app端的下载量及日活用数皆很可观。3月21日下午,Kimi的APP、小程序以及网页版均显示无法正常使用。公司表示自3月20日观测到流量异常高增后,已经进行了5此扩容工作,而推理资源会持续配合进行扩容,以承载持续增长的用户量。同时,百度、阿里纷纷准备开放长文本能力。随着大模型流量的高增以及长文本上下文长度的提升,算力需求有望持续提升。 浦俊懿021-63325888*6106pujunyi@orientsec.com.cn ⚫阶跃星辰发布Step-2万亿参数MoE语言大模型预览版,万亿参数模型对算力提出极高要求。3月23日,阶跃星辰发布Step系列通用大模型,包括Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型,以及Step-2万亿参数MoE语言大模型的预览版,提供API接口给其部分合作伙伴试用。据阶跃星辰,万亿参数大模型至少需要等效A800万卡单一集群和高效稳定的训练。我们认为,随着阶跃星辰等大模型顺着Scalinglaw在万亿参数及多模态大模型中的不断攀升,算力需求有望进一步提升。 执业证书编号:S0860514050004陈超021-63325888*3144chenchao3@orientsec.com.cn执业证书编号:S0860521050002 覃俊宁qinjunning@orientsec.com.cn宋鑫宇songxinyu@orientsec.com.cn ⚫上海发布2024-2025算力浦江计划,设立智算规模及智算国产化等目标。3月21日,上海十一部门联合印发《上海市智能算力基础设施高质量发展“算力浦江”智算行动实施方案(2024-2025年)》。该方案设立多个智算建设目标:到2025年,上海智能算力规模超过30EFlops,占比达到总算力的50%以上;新建智算国产算力芯片占比超50%等。政府持续积极推动智算建设与算力国产化,国产算力条线值得关注。 阶跃星辰发布万亿参数MoE模型,大模型混战进入新阶段2024-03-23 Kimi支持200万字上下文,AI应用有望加速落地2024-03-22 ⚫随着Kimi等大模型访问量持续高增、长文本长度提升、模型参数以及训练token数量提升,推理算力以及训练算力的需求有望持续提升。在算力的浪潮中,算力国产化是长期趋势。我们认为,算力需求有望持续提升。随着以Kimi为首的大模型的火爆,访问量等持续高增,各家推理算力的扩容势在必行。另外,随着长文本上下文长度的提升,算力的消耗也必将提升。而随着Kimi等大模型的不断迭代升级,模型参数量以及训练数据量皆有望持续提升,Scalinglaw将持续发挥作用,拉动算力需求。国产AI芯片厂商、国产AI芯片条线及英伟达条线服务器厂商、算力租赁、IDC、服务器运维等算力服务商皆有望持续获益。 投资建议与投资标的 ⚫国产算力:建议关注海光信息(688041,买入)、寒武纪-U(688256,未评级)、高新发展(000628,未评级)、神州数码(000034,未评级)、烽火通信(600498,未评级)、软通动力(301236,未评级)、广电运通(002152,买入)等 ⚫英伟达算力链:建议关注浪潮信息(000977,未评级)、紫光股份(000938,买入)等 ⚫算力服务提供方:建议关注云赛智联(600602,未评级)、润泽科技(300442,未评级)、亚康股份(301085,未评级)、优刻得-W(688158,未评级)、首都在线(300846,未评级)、深桑达A(000032,未评级)、铜牛信息(300895,未评级)、华铁应急(603300,买入)等 风险提示 AI大模型相关产业发展不及预期风险;算力相关政策落地不及预期风险;算力发展不及预期风险。 目录 一、国内大模型进展快速,算力需求有望进一步提升..............................4 1.1 Kimi火爆,五次扩容网站仍过载停工,算力需求有望进一步提升................................41.2阶跃星辰发布万亿参数大模型预览版,拉动算力需求提升...........................................5 二、上海11部门联合印发“算力浦江”方案,设立智算规模以及智算国产化 目标7 三、产业政策齐发力,算力条线值得关注................................................8 投资建议与投资标的......................................................................................8 风险提示........................................................................................................8 图表目录 图1:Kimi支持200万字上下文...................................................................................................4图2:本周Kimi app进入app store免费版前五名.......................................................................4图3:月之暗面针对网站异常进行说明——已扩容五次,会持续扩容。.......................................4图4:通义千问免费开放1000万字长文档处理功能.....................................................................5图5:大模型长文本的“不可能三角”..............................................................................................5图6:阶跃星辰携手云赛智联等持股上海智能算力科技有限公司..................................................6图7:上海智能算力科技有限公司进行国产化算力设备招标.........................................................6图8:上海市通信管理局等11个部门联合印发《上海市智能算力基础设施高质量发展“算力浦江”智算行动实施方案(2024-2025年)》..........................................................................................7图9:算力浦江设立智算规模目标以及国产化芯片占比目标.........................................................7 一、国内大模型进展快速,算力需求有望进一步提升 1.1 Kimi火爆,五次扩容网站仍过载停工,算力需求有望进一步提升 Kimi爆火,访问量、app端的下载量及日活用数可观。本周,月之暗面宣布Kimi已可以支持200万字超长无损上下文,该智能助手主要有“长文总结和生成、联网搜索、数据处理、编写代码、用户交互、翻译”等6项功能。近期,Kimi持续火爆,访问量、app端的下载量以及日活用数都非常客观。根据“AI产品榜aicpb.com”的统计数据,2024年2月Kimi智能助手的访问量305万,在大模型创业公司的“AI ChatBots”产品中排在第一;月环比增长达107.6%。另外,Kimi目前的日活用户数已达100万人。其APP一度冲进appstore免费app排行前五。 数据来源:Kimi、量子位、东方证券研究所 Kimi由于流量高增宕机,月之暗面表示已进行五次扩容,并将持续对推理资源进行扩容。3月21日下午,Kimi的APP、小程序以及网页版均显示无法正常使用。月之暗面针对相关情况发布说明:“从3月20日9点30分开始,观测到Kimi的系统流量持续异常增高,流量增加的趋势远超对资源的预期规划。这导致了从20日10点开始,有较多的SaaS客户持续的体验到429:engineis overloaded的异常问题,并对此表示深表抱歉。”公司表示自3月20日观测到流量异常高增后,已经进行了5此扩容工作,而推理资源会持续配合进行扩容,以承载持续增长的用户量。 百度、阿里纷纷准备开放长文本能力。随着Kimi的火爆,多家大模型厂商纷纷官宣开放自家长文本能力。其中,3月22日,据科创版日报,百度文心一言下个月将进行版本升级,届时也将开放长文本能力,文字范围会在200万-500万。同一天,阿里宣布通义千问大模型迎来重磅升级,将向所有人免费开放1000万字的长文档处理功能,成为全球文档处理容量第一的AI应用。 大模型上下文长度拓展存在“不可能三角”:文本长度、注意力和算力。Transformer架构依赖于自注意力机制来处理输入序列。随着序列长度的增加,自注意力层的计算复杂度呈二次方增长,其中n是序列长度。这意味着对于较长的序列,模型需要进行大量的计算,这也对算力提出了更高的要求,从两个方面共同限制了大模型上下文长度的无限拓展。上下文文本越长,模型越难聚焦充分注意力,难以完整理解用户意图;注意力限制下,短文本无法完整解读复杂信息;处理长文本需要大量算力,从而提高了成本。按GPT-4Turbo目前API的输入输出价格来计算,要用满128k的长度进行一次输入输出的话,一次问答的价格超过30元。 1.2阶跃星辰发布万亿参数大模型预览版,拉动算力需求提升 阶跃星辰发布Step-2万亿参数MoE语言大模型预览版,万亿参数模型对算力提出极高要求。2024年3月23日,阶跃星辰发布Step系列通用大模型,包括Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型,以及Step-2万亿参数MoE语言大模型的预览版,提供API接口给其部分合作伙伴试用。阶跃星辰顺着Scaling law持续攀登,在万亿参数和多模态的新战场 中持续演进。据阶跃星辰,万亿参数大模型至少需要等效A800万卡单一集群,高效稳定的训练,以及十万亿tokens高质量的数据。 阶跃星辰具有算力储备、且具有万卡集群建设管理能力。公司携手云赛智联、上海仪电等上海国资企业,成立智能算力子公司。阶跃星辰具备打造万亿参数模型的坚实基础。公司通过自建机房+租用算力,积极进行算力储备;核心团队曾实践过单集群万卡以上的系统建设与管理。训练千亿模型的MFU(有效算力输出)达57%。同时,阶跃星辰与上海仪电、云赛智联等主体参股上海智能算力科技有限公司,积极进行智算储备。据公开招标,上海智能算力科技有限公司于2023年11月进行招标,针对智算集群一期的项目采购一体化智算集群平台、智算集群平台迭代开发以及智算集群平台建设及运维管理系统。其中,招标文件表示一体化智算集群平台需满足一万张GPU卡和两千颗CPU的智能调度能力。 二、上海11部门联合印发“算力浦江”方案,设立智算规模以及智算国产化目标 3月21日,上海发布2024-2025算力浦江计划,设立多个目标。3月21日,上海市通信管理局会同市委网信办、市发展改革委、市数据局等十一部门研究制定了《上海市智能算力基础设施高质量发展“算力浦江”智算行动实施方案(2024-2025年)》。该方案设立了一系列建设目标,要求形成上海算力交易平台、