2022年11月ChatGPT发布,引爆国内百模大战,创业玩家如雨后春笋,互联网巨头也纷纷下场,巅峰时期国内公开大模型数量超越300个。 如今一年半过去,巨头们依托固有业务,更早形成壁垒,率先晋级。而创业玩家这边,胜局也已锁定, ,目前或许只有少数几家公司拿到了和巨头角逐下半场的门票。 他们分别是 ——智谱AI、MiniMax、阶跃辰星、百川智能、月之暗面和零一万物,这六家 公司后背都转起了一个关键飞轮——模型、应用和融资飞轮,这使得他们能够与巨头同场竞技。另外,这一赛道上还有——面壁智能和DeepSeek。 他们共同组成了许多人认为,继移动互联网之后的AI时代,新的巨头或将从这八家公司中诞生。 而放眼全球,美国大模型行业同样存在类似的阶段性竞争格局变化,像曾经的移动互联网时代一样,中美再次在两个“平行宇宙”中上演新的历史进程…… 在本篇报告中,量子位智库将以一个逐步放大的视角,从国内创业玩家“6+2”格局、国内巨头玩家格局、海外玩家格局三个层次,力求为读者描绘大模型行业格局完整画卷。 国内创业玩家“6+2”格局总览 分类创始人模型C端产品B端产品最新估值 学院派唐杰GLM智谱清言、清影 API、云端私有化、本地私有化 约30亿美元 创青年派 闫俊杰 abab 星野、海螺、 Talkie API 约25亿美元 模型创始人 创 业杨植麟 六 Moonshot Kimi API 约30亿美元 业MiniCPM 特 李大海 刘知远 小姜大昕 强 Step 跃问、冒泡鸭AI金融、AI内容 创作 约20亿美元*别 关 大佬派 王小川 Baichuan 百小应、健康顾问 MaaS+AaaS行业解决方案 数字人解决方案 超20亿美元 注 模型创始人 李开复Yi- 全行业ToB解决方案、AIInfra解决方案 超10亿美元 *为投前估值 DeepSeek梁文锋 2019.06 2021.12 2022.08 2023.03 2023.04.06 2023.04.10 2023.05.16 2023.07.17 智谱AI成立 MiniMax成立 面壁智能成立 月之暗面成立 阶跃辰星成立 百川智能成立 零一万物成立 深度求索成立 2020.06.11 OpenAI发布 GPT-3 2022.11 OpenAI发布ChatGPT,引爆百模大战 国内创业玩家核心竞争力四维度 竞争力维度具体内容 模型在模型维度上,本章将根据各家创业公司特点有侧重地介绍其研发历程、模型能力特点、架构特色、矩阵构成、Benchmark成绩、AGI路径规划等情况中的一到三项。 应用在应用维度上,本章将根据各家创业公司特点有侧重地介绍其大模型应用矩阵、特色应用、主力应用、实现功能、用户数据、战略特点、生态布局、付费模式等情况中的一到三项。 融资在融资维度上,本章将介绍各家创业公司融资历程,具体包括历次融资时间、轮次、金额、估投资值及机构。 团队在团队维度上,本章将介绍各家创业公司核心团队成员情况,具体包括教育背景、学术影响力、重要头衔、相关工作履历等信息。 智谱AI——模型:清华系成果转化,自研底层架构,对标OpenAI 脱胎于高校实验室,技术成熟自然转化:智谱AI脱胎于清华KEG实验室,是清华计算机系技术成熟到一定程度的转化成果,于2019年6月正式成立发布自研百亿参数大模型GLM,彼时GPT-3.5还未发布。 自研底层框架打破垄断,矩阵全对面标OpenAI:2022年3月,唐杰团队提出了全新自研的通用预训练框架GLM,打破当时西方垄断主流大模型预训练框架技术路径的局面。智谱AI在模型和产品矩阵甚至投资策略上均对标OpenAI,最新的GLM-4座基大模型能力多方位接近世界领先水平。 199620212022.082024.01 清华KEG实验室成立致力于网络环境下知识工程理论、方法和应用研究 2015.122019.062020.06 OpenAI正式成立智谱AI正式成立OpenAI发布GPT-3 OpenAIvs智谱 品 智谱百亿参数大模型GLM发布,采用全新预训练模型框架 智谱发布开源千亿大模GLM-130B,效果对标GPT-3175B Open2A0I2发2.布12GPT- 3.5,引爆百模大战 智谱上20线23A.I0助8手应用“智谱清言” 智谱发布最新一代基座大模型GLM-4性能 达到国际领先水平 2024.07 智谱发布视频生 成功能“清影” 智谱GLM-4(0520)在GSM8K、MATH、BBH、GPQA、HumanEval 投面等多个国际主流Benchmark上成绩超过GPT-4(0314)。 信息来源:智谱及公开信息整理 智谱AI——应用:工程基因,侧重ToB,商业化进程身位领先 ToB基因突出,主打MaaS平台:智谱脱胎的清华KEG知识工程研究室自90年代就强调工程落地,造就了团队将技术落地到需求中的做事风格。智谱团队以ToB背景为主,商业化重心在B端,智谱大模型开放平台目前已有超40万的企业用户,主要覆盖金融、教育、互联网、零售、汽车、能源、传统制造业等行业。 ToC侧重生产力应用,视频生成功能“清影”上线:智谱ToC业务目前仍以免费为主,主力应用“智谱清言”,截至2024年6月历史下载量突破500万,同时智谱清言也是智能体开发平台,目前已有超过30万个智能体活跃在智谱清言APP可供使用,2024年7月新上线视频生成功能“清影”,对标Sora,免费公开使用不限次。 AI汽车智能座舱市场营销售后服务研发制造 AI手机 AI医疗 售后服务 生活服务助手AI旅行 AIBIAI质检 AI金融 AI陪伴AI导购AI客服 AI供应链AI风控AI营销 其他 依据量子位智库发布的《AI智能助手APP8月榜单》,智谱的ToC主力 API单日调用量API单日调用tokens服务企业客户 应用智谱清言下载量突破500万,位列第七。(完整报告数据请查看量 600万+400亿+30万+子位智库公众号) 信息来源:智谱及公开信息整理 智谱AI——融资:融资轮次多、估值领先,全产业链投资积极布局生态 融资金额及估值处于第一梯队:智谱目是前国内估最值高的大模型初创公司之一,最新一轮融资估报值据传为30亿美元,从团队背景、模型开发进展、商业化方向及资金储备情况来看,公司处于国内AI创业公司头部。 积极布局产业生态,投资多家技术优势公司:为打造自己的AI大模型生态圈,智谱参与了十多家AI大模型产业相关创业公司的投资,被企投业多为清华系,且以技术导向为主。 智谱 时间轮次金额估值投资机构投 2024/09 B+轮 数十亿 200亿中关村科学城资 布 2024/03 B+轮 - 美元 - 2024/01 B+轮 - - 2023/10 B+轮 - - 2023/09 B+轮 12亿 25亿 2023/07 B+轮 约3亿 40亿 2023/05 B+轮 约4亿 40亿 2022/09 B轮 约2亿 20亿 2021/09 A轮 约1.5亿 - 2021/04 天使轮 - - 2019/08 种子轮 - - 2024/05 B+轮 约4亿美元 约30亿 Prosperity7Ventures局 顺禧金基 光速光合 发起总额为10亿人民币的大模型创业基金,支持大模型 蚂蚁集团对创业者原始创新,覆盖大模型法算、底层算子、芯片优化、行业大模型和超级应用等各方面。 好未来、小米、红杉、美团、腾讯投资、金山软件、阿里 巴巴、顺为资本、高瓴资本、君联资本分别联合CCF中国计算机学会、中国中文信息学会社会媒 美团 今日资本,蚂蚁金服,光速中国启明创投,君联资本,华控金基 图灵创投、凌云光、华控基金、将门创投、海南智桥、 对学术界 体处理专委会发起了CCF-智谱大模型基金、SMP-智谱大模型交叉学科基金,用于支持大模型理论、算法、模型、 应用等相关研究和跨领域交叉创新。 IMOVentures、达晨财智、北京荣品 成立大模型开源计金基用,计划累 1000张GPU、 北京创新智源 科技有限公司 中科创、星华控技术转移有限公司、清控资管集团 对开社源区 1000万人民币和1000亿tokens来支持人工智能开建区社源。设 信息来源:智谱、相关报道及公开信息整理 智谱AI——团队:学院派代表,清华计算机系人才众多 依托清华AI人才资源:截至2024年9月,公司员工共计600余人,其中大模型研发人员接近半数,其余为客户服务落地人员及产人品员。公司借助清华系高校背景,持续吸引高端人才。 团队具备从研发到落地全栈能力:公司团队源自清华知识工程研究室KEG,该实验室自90年代成立起就走的是“科研+工程化落地”路线,团队成员具备深厚技术积累及综合运营经验;创始人唐杰教授认是知智能领域顶尖专家,具备20余年人工智能领域研究经验。 唐杰 创始人技术顾问 张鹏 CEO 张帆 COO 清华大学计算机清科华学计与算机技系术本工硕学博博,士中、国I新EE闻EF信e息llo标w准化分会委员机硕士、法国梅斯大学计算机硕巴士黎第十一大学计算 清华大学计算机系教授,研究方向知识图谱电子学会标准化工作委员会机器人技术委员会委员 曾主导开发全球最大万亿级超大规模预训练模型悟道在ICML、ISWC等顶级会议上发表10余篇文章 曾任大搜车集团CTO,曾创立元因智能任CEO,创立妙计旅行任CEO,智是能技术领域连续创业者 曾在字节,腾讯,搜狗从事技术管理工作 王绍兰总裁 曾任清华数据科学研究院科技大数据研究中心副主任 凹凸科技北京公司总经理 获得授权发明专利15项,美国发明专利2项 信息来源:智谱及公开信息整理 刘德兵董事长 20余年技术和政府项目综合经验 清华数据科学研究院科技大数据研究中心副主任 中科院计所算博士,师从高文院士 获得授权发明专利40余项,国际标准一项 MiniMax——模型:选择混合专家架构技术路径,打造多模态模型 国内最早研发MoE及LinearAttention:2023年6月,MiniMax在MoE混合专家架构仍是行业非共识时选择AllinMoE,彼时行业大部分公司仍在训练Dense稠密模型。2024年1月,MiniMax发布千亿参数MoE架构模型;4月底,推出万亿参数MoE架构模型。即将发布的abab7模型将基于MOE+LinearAttention。 围绕产需品求打造全矩阵多模态模型:截至2024年9月,MiniMax已推出视频大模型、音乐大模型及语音大模型,最新主力模型abab6.5在多项核心能力上开始接近世界最领先大语言模型水平。 模Dense •由自注意力机制层( SA)和前馈神经网络层(FFN)组成,每 一层都与前层直接相模 连。型 •每次前向传播中所有矩 的参数都被激活和使阵 用,需要的计算量和 视频大模型音乐大模型语音大模型单日交互次数 30亿次 abab-video-1abab-music-1abab-speech-1 日均处理 Tokens 压缩率高、文本响应好、支持多功能端到端音乐生支持粤语、韩语、⻄班牙 风格多样,支持原生高分成,可合成多种音乐形式,语等多语种,生成语句超 型稠密模型 架构对比 显存更大。 •自注意力机制层(SA)后接了多个前馈神经 网络层(FFN)。主 •在每次前向传播中,流 由路由机制选择性激测 活部分FFN。试 •可减少计算量和显存集 辨率、高帧率视频 支持伴奏人声同时生成拟人,情绪细腻自然 3万亿 abab6.5系列包含两个模型:abab6.5和abab6.5s。在各类核心能力测试中,abab6.5开始接近GPT-4、Claude-3、Gemini-1.5等世界上最领 MoE 混合专家模型 需求,同时提高模型 在同等条件下的灵活性和容量。 成先的大语言模型。 绩 源 信息来源:MiniMax及公开信息整理 MiniMax——应用:以娱乐陪伴方向为主,专注打造超级应用 ToC打造超级应用工厂:MiniMax是国内创业