2024年03月24日 计算机 Kimi升级+阶跃星辰发布,国产大模型黑马蓄势跃升 事件概述: 首选股票目标价(元)评级 1)3月23日,通用大模型创业公司阶跃星辰在2024全球开发者先 锋大会期间正式对外亮相,并在大会开幕式上发布了Step系列通用大模型,包括Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型,以及Step-2万亿参数MoE语言大模型的预览版。 计算机 沪深300 35% 25% 15% 5% -5% -15% -25% -35% -45% 2023-032023-072023-112024-03 行业表现 2)3月18日,AI大模型初创企业月之暗面宣布Kimi智能助手在长上下文窗口技术上再次取得突破,无损上下文长度从20万字提升至 200万字,即日起,支持200万字上下文的Kimi已启动“内测”。 行业动态分析 证券研究报告投资评级领先大市-A维持评级 Kimi扩容“内存”,200万字长文本能力全球领先 3月18日,公司宣布Kimi智能助手在长上下文窗口技术上再次取得 突破,无损上下文长度从20万字提升到200万字,在单点能力上已经超越了海外的大模型。支持更长的上下文意味着大模型拥有更大的“内存”,从而使得大模型的应用更加深入和广泛:比如通过多篇财报进行市场分析、处理超长的法务合同、快速梳理多篇文章或多个网页的关键信息、基于长篇小说设定进行角色扮演等。百万字无损上下文阅读能力帮助Kimi高速掌握新领域,过去要10000小时才能成为专家的领域,现在只需10分钟,Kimi就能接近任何一个新领域的初级专家水平。 阶跃星辰重磅发布万亿参数MoE大模型预览版 阶跃星辰自成立起,在算力、数据、算法和系统这四大要素上综合布局,在大模型技术路径上坚定投入攀登ScalingLaw。阶跃星辰发布的Step-1V千亿参数多模态大模型多模理解能力突出,可以精准描述和理解图像中的文字、数据、图表等信息,并根据图像信息实现内容创作、逻辑推理、数据分析、视频理解等多项任务。千亿参数模型只是阶跃星辰团队在攀登通用人工智能路上迈出的第一步。此次大会上阶跃星辰还发布了Step-2万亿参数语言大模型预览版,提供API接口给部分合作伙伴试用。 建议关注: 1)AI算力:润泽科技、云赛智联、中科曙光等。 2)AI应用:金山办公、福昕软件、万兴科技、金蝶国际、彩讯股份、致远互联、拓尔思、通达海、华宇软件等。 风险提示: AI技术发展不及预期;行业竞争加剧。 资料来源:Wind资讯 升幅%1M 相对收益14.0 绝对收益15.7 3M -5.9 0.3 12M -6.1 -17.5 赵阳分析师 SAC执业证书编号:S1450522040001 zhaoyang1@essence.com.cn 夏瀛韬分析师 SAC执业证书编号:S1450521120006 xiayt@essence.com.cn 马诗文联系人 SAC执业证书编号:S1450122050037 masw2@essence.com.cn 相关报告英伟达GTC2024召开在即, 2024-03-17 AI、机器人或迎来催化计算机投资视角解读两会和 2024-03-11 新质生产力海外国内共振,AI算力引领 2024-03-04 科技投资高景气卫星互联网产业化积极推 2024-02-26 进,发射端、卫星端获进展文生视频模型Sora有望引 2024-02-19 领AI新景气 内容目录 1.Kimi:无损长文本处理能力全球领先3 2.阶跃星辰:发布万亿参数MoE大模型预览版6 图表目录 图1.Kimi智能助手启动200万字无损上下文内测3 图2.Kimi能够快速分析总结出英伟达的财报历史3 图3.Kimi根据500份简历筛选候选人信息4 图4.Kimi能够快速分析对比上市公司财报数据4 图5.Kimi访问量激增5 图6.Step-1V的优势6 图7.上海智能算力科技有限公司股权结构7 图8.通往AGI的路径方向7 图9.个人效率助手—跃问8 图10.AI开放世界平台—冒泡鸭8 1.Kimi:无损长文本处理能力全球领先 Kimi长文本输入量提升10倍,目前全球领先。AI大模型初创企业月之暗面(MoonshotAI)创立于2023年3月,主力产品Kimi智能助手在2023年10月初次亮相,凭借约20万汉字 的无损上下文能力,帮助用户解锁了很多新的使用场景,包括专业学术论文的翻译和理解、辅助分析法律问题、一次性整理几十张发票、快速理解API开发文档等,获得了良好的用户口碑和用户量的快速增长。今年3月18日,公司宣布Kimi智能助手在长上下文窗口技术上再次取得突破,无损上下文长度提升了一个数量级到200万字。根据机器之心数据,尚未上 线的GPT-4.5Turbo上下文窗口指定为25.6万个token,Kimi此次升级后长文本能力是其10倍,是目前全球市场上能够产品化使用的大模型服务中所能支持的最长上下文输入长度。 图1.Kimi智能助手启动200万字无损上下文内测 资料来源:MoonshotAI官方公众号,国投证券研究中心 更长上下文意味着更大“内存”,提高海量文件处理效率。从技术视角看,参数量决定了大模型支持多复杂的“计算”,而能够接收多少文本输入(即长文本技术)则决定了大模型有 多大的“内存”,两者共同决定模型的应用效果。支持更长的上下文意味着大模型拥有更大的“内存”,从而使得大模型的应用更加深入和广泛:比如通过多篇财报进行市场分析、处理超长的法务合同、快速梳理多篇文章或多个网页的关键信息、基于长篇小说设定进行角色扮演等。同时,KimiChat通过创新的网络结构和工程优化,在千亿参数下实现了无损的长程注意力机制,不依赖于滑动窗口、降采样、小模型等对性能损害较大的“捷径”方案。 图2.Kimi能够快速分析总结出英伟达的财报历史 资料来源:MoonshotAI官方公众号,国投证券研究中心 图3.Kimi根据500份简历筛选候选人信息 资料来源:MoonshotAI官方公众号,国投证券研究中心 智能检索并分析总结与长文本处理能力息息相关:Kimi可以根据用户的问题,主动去互联网上搜索、分析和总结最相关的多个页面,搜索得到的多篇资料,会作为上下文的一部分交给模型去推理,生成更直接、更准确的答案。正是因为Kimi大模型支持的上下文窗口足够长, 窗口内的信息损失足够低,Kimi智能助手才能输出高质量的结果。例如,用户可以让Kimi主动去搜索和对比两家同领域上市公司的最新财报数据,直接生成对比表格,节省大量的资料查找时间。 图4.Kimi能够快速分析对比上市公司财报数据 资料来源:KIMI智能助手,国投证券研究中心 多轮交互和超长指令遵循能力突出:与大模型的无损上下文能力息息相关的指标是指令遵循 (InstructionFollowing)能力。指令遵循能力主要体现在两个方面:1)模型在多轮对话中是否能够始终遵循用户的指令,理解用户的需求;2)模型是否能够遵循复杂指令,有时候复杂指令可能长达几千、上万字。从产品推出以来的用户反馈来看,Kimi智能助手的多轮 交互和超长指令遵循能力,也是产品的一项核心优势。 Kimi流量增加趋势远超预期,已采取扩容等紧急措施。根据Similarweb数据,Kimi网页版日活用户数当前已连续数日超20万,峰值日活达34.6万,周活数据环比增长45%持续创新 高。月之暗面发布情况说明,从2024年3月20日9:30开始观测到Kimi的系统流量持续异 常增高,流量增加的趋势远超公司对资源的预期规划。这导致了从3月20日10:00开始,有较多的SaaS客户持续的体验到429:engineisoverloaded的异常问题,对此公司深表抱歉,已经有多项应急措施正在实施,包括不限于:从观测到流量异常增高后,已经进行了5次扩容工作。推理资源会持续配合流量进行扩容,以尽量承载持续增长的用户量;设计了一套更有效的SaaS流量优先级策略,以保障付费用户的调用稳定,预计3月25日之前完成并上线。 图5.Kimi访问量激增 资料来源:similarweb,国投证券研究中心 顶尖算法工程人才汇聚,创始团队成员参与过多个大模型研发。月之暗面团队创始人杨植麟,本科毕业于清华大学计算机科学与技术系,博士就读于全美自然语言处理排名第一的卡内基梅隆大学语言技术研究所(LTI),杨植麟本人学术引用量自2019年起已超2万余次。在算 法和工程领域,月之暗面囊括了自然语言处理、计算机视觉、强化学习、基础设施等方面的新生代人才,创始团队的核心成员参与了GoogleGemini、GoogleBard、盘古NLP、悟道等多个大模型的研发,多项核心技术被GooglePaLM、MetaLLaMa、StableDiffusion等主流产品采用。 建议关注:润泽科技(Kimi+算力)、福昕软件(Kimi+文档处理)、金山办公(Kimi+办公套件)、万兴科技(Kimi+视频创意)、金蝶国际(Kimi+企业管理)、彩讯股份(Kimi+邮箱)、拓尔思(Kimi+公文写作)、华宇软件/通达海(Kimi+法律文件)等。 2.阶跃星辰:发布万亿参数MoE大模型预览版 阶跃星辰Step-1V多模理解能力突出,并蓄力发布万亿参数模型。通用大模型创业公司阶跃星辰成立于2023年4月。2024年3月23日,公司在上海举行的2024全球开发者先锋大会 期间正式对外亮相,阶跃星辰创始人、CEO姜大昕博士在大会开幕式上对外发布了Step系列通用大模型。Step-1V千亿参数多模态大模型的多模理解能力突出,可以精准描述和理解图像中的文字、数据、图表等信息,并根据图像信息实现内容创作、逻辑推理、数据分析、视频理解等多项任务。该模型在中国权威的大型模型评估平台“司南”(OpenCompass)多模态模型评测榜单中位列第一,性能比肩GPT-4V。此次大会上还发布了Step-2万亿参数MoE语言大模型预览版,该模型采用MoE架构,聚焦深度智能的探索,并提供API接口给部分合作伙伴试用。训练万亿参数模型体现了阶跃星辰的核心技术能力和探索通用人工智能的决心。 图6.Step-1V的优势 资料来源:阶跃星辰官网,国投证券研究中心 创始团队坚定投入攀登Scalinglaw,在算力/数据/算法/系统四大要素布局。创始人和CEO是前微软全球副总裁、微软亚洲互联网工程院首席科学家姜大昕博士,核心创始团队包括系统负责人朱亦博博士和数据负责人焦斌星博士。姜大昕是自然语言处理领域的全球知名专家, 在机器学习、数据挖掘、自然语言处理和生物信息学等领域拥有丰富的研究及工程经验。朱亦博拥有多次单集群万卡以上的系统建设与管理实践经验。焦斌星此前担任微软必应引擎核心搜索团队负责人,负责利用数据挖掘和NLP算法优化索引和搜索质量。阶跃星辰在大模型技术路径上坚定投入攀登ScalingLaw。根据阶跃星辰数据,等效A800万卡单一集群,高效稳定的训练,十万亿tokens高质量的数据,加上驾驭新颖的MoE架构,任何一环出现短板,Scalinglaw就攀登不上去。因此公司自成立起,在算力、数据、算法和系统这四大要素上综合布局: 1)算力:通过自建机房+租用算力,积极进行算力储备。前瞻布局算力资源,阶跃星辰出资 2亿元人民币投资上海智能算力科技有限公司并持股10%。(该公司大股东为上海仪电集团, 持股44%,云赛智联持股11%。) 2)系统:实践过单集群万卡以上的系统建设与管理。训练千亿模型的MFU(有效算力输出)达57%。 3)数据:数据团队核心骨干来自必应搜索引擎,曾支持全球100多种语言,为200多个国家和地区提供服务。对全球互联网高质量语料的分布有深入了解。并建立起强大的数据处理 和知识图谱流水线。 4)算法:团队不仅能驾驭各种架构,比如万亿参数的MoE架构,并且对大模型的认知以及发展路线有深刻洞察。 图7.上海智能算力科技有限公司股权结构 资料来源:爱企查,国投证券研究