您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[北京极客伙伴科技]:AI大模型创业格局报告 - 发现报告
当前位置:首页/行业研究/报告详情/

AI大模型创业格局报告

信息技术2024-09-30王昕祎北京极客伙伴科技福***
AI智能总结
查看更多
AI大模型创业格局报告

2022年11月ChatGPT发布,引爆国内百模大战,创业玩家如雨后春笋,互联网巨头也纷纷下场,巅峰时期国内公开大模型数量超越300个。 如今一年半过去,巨头们依托固有业务,更早形成壁垒,率先晋级。而创业玩家这边,胜局也已锁定, ,目前或许只有少数几家公司拿到了和巨头角逐下半场的门票。 他们分别是 ——智谱AI、MiniMax、阶跃辰星、百川智能、月之暗面和零一万物,这六家 公司后背都转起了一个关键飞轮——模型、应用和融资飞轮,这使得他们能够与巨头同场竞技。另外,这一赛道上还有——面壁智能和DeepSeek。 他们共同组成了许多人认为,继移动互联网之后的AI时代,新的巨头或将从这八家公司中诞生。 而放眼全球,美国大模型行业同样存在类似的阶段性竞争格局变化,像曾经的移动互联网时代一样,中美再次在两个“平行宇宙”中上演新的历史进程…… 在本篇报告中,量子位智库将以一个逐步放大的视角,从国内创业玩家“6+2”格局、国内巨头玩家格局、海外玩家格局三个层次,力求为读者描绘大模型行业格局完整画卷。 国内创业玩家“6+2”格局总览 分类创始人模型C端产品B端产品最新估值 学院派唐杰GLM智谱清言、清影 API、云端私有化、本地私有化 约30亿美元 创青年派 闫俊杰 abab 星野、海螺、 Talkie API 约25亿美元 模型创始人 创 业杨植麟 六 Moonshot Kimi API 约30亿美元 业MiniCPM 特 李大海 刘知远 小姜大昕 强 Step 跃问、冒泡鸭AI金融、AI内容 创作 约20亿美元*别 关 大佬派 王小川 Baichuan 百小应、健康顾问 MaaS+AaaS行业解决方案 数字人解决方案 超20亿美元 注 模型创始人 李开复Yi- 全行业ToB解决方案、AIInfra解决方案 超10亿美元 *为投前估值 DeepSeek梁文锋 2019.06 2021.12 2022.08 2023.03 2023.04.06 2023.04.10 2023.05.16 2023.07.17 智谱AI成立 MiniMax成立 面壁智能成立 月之暗面成立 阶跃辰星成立 百川智能成立 零一万物成立 深度求索成立 2020.06.11 OpenAI发布 GPT-3 2022.11 OpenAI发布ChatGPT,引爆百模大战 国内创业玩家核心竞争力四维度 竞争力维度具体内容 模型在模型维度上,本章将根据各家创业公司特点有侧重地介绍其研发历程、模型能力特点、架构特色、矩阵构成、Benchmark成绩、AGI路径规划等情况中的一到三项。 应用在应用维度上,本章将根据各家创业公司特点有侧重地介绍其大模型应用矩阵、特色应用、主力应用、实现功能、用户数据、战略特点、生态布局、付费模式等情况中的一到三项。 融资在融资维度上,本章将介绍各家创业公司融资历程,具体包括历次融资时间、轮次、金额、估投资值及机构。 团队在团队维度上,本章将介绍各家创业公司核心团队成员情况,具体包括教育背景、学术影响力、重要头衔、相关工作履历等信息。 智谱AI——模型:清华系成果转化,自研底层架构,对标OpenAI 脱胎于高校实验室,技术成熟自然转化:智谱AI脱胎于清华KEG实验室,是清华计算机系技术成熟到一定程度的转化成果,于2019年6月正式成立发布自研百亿参数大模型GLM,彼时GPT-3.5还未发布。 自研底层框架打破垄断,矩阵全对面标OpenAI:2022年3月,唐杰团队提出了全新自研的通用预训练框架GLM,打破当时西方垄断主流大模型预训练框架技术路径的局面。智谱AI在模型和产品矩阵甚至投资策略上均对标OpenAI,最新的GLM-4座基大模型能力多方位接近世界领先水平。 199620212022.082024.01 清华KEG实验室成立致力于网络环境下知识工程理论、方法和应用研究 2015.122019.062020.06 OpenAI正式成立智谱AI正式成立OpenAI发布GPT-3 OpenAIvs智谱 品 智谱百亿参数大模型GLM发布,采用全新预训练模型框架 智谱发布开源千亿大模GLM-130B,效果对标GPT-3175B Open2A0I2发2.布12GPT- 3.5,引爆百模大战 智谱上20线23A.I0助8手应用“智谱清言” 智谱发布最新一代基座大模型GLM-4性能 达到国际领先水平 2024.07 智谱发布视频生 成功能“清影” 智谱GLM-4(0520)在GSM8K、MATH、BBH、GPQA、HumanEval 投面等多个国际主流Benchmark上成绩超过GPT-4(0314)。 信息来源:智谱及公开信息整理 智谱AI——应用:工程基因,侧重ToB,商业化进程身位领先 ToB基因突出,主打MaaS平台:智谱脱胎的清华KEG知识工程研究室自90年代就强调工程落地,造就了团队将技术落地到需求中的做事风格。智谱团队以ToB背景为主,商业化重心在B端,智谱大模型开放平台目前已有超40万的企业用户,主要覆盖金融、教育、互联网、零售、汽车、能源、传统制造业等行业。 ToC侧重生产力应用,视频生成功能“清影”上线:智谱ToC业务目前仍以免费为主,主力应用“智谱清言”,截至2024年6月历史下载量突破500万,同时智谱清言也是智能体开发平台,目前已有超过30万个智能体活跃在智谱清言APP可供使用,2024年7月新上线视频生成功能“清影”,对标Sora,免费公开使用不限次。 AI汽车智能座舱市场营销售后服务研发制造 AI手机 AI医疗 售后服务 生活服务助手AI旅行 AIBIAI质检 AI金融 AI陪伴AI导购AI客服 AI供应链AI风控AI营销 其他 依据量子位智库发布的《AI智能助手APP8月榜单》,智谱的ToC主力 API单日调用量API单日调用tokens服务企业客户 应用智谱清言下载量突破500万,位列第七。(完整报告数据请查看量 600万+400亿+30万+子位智库公众号) 信息来源:智谱及公开信息整理 智谱AI——融资:融资轮次多、估值领先,全产业链投资积极布局生态 融资金额及估值处于第一梯队:智谱目是前国内估最值高的大模型初创公司之一,最新一轮融资估报值据传为30亿美元,从团队背景、模型开发进展、商业化方向及资金储备情况来看,公司处于国内AI创业公司头部。 积极布局产业生态,投资多家技术优势公司:为打造自己的AI大模型生态圈,智谱参与了十多家AI大模型产业相关创业公司的投资,被企投业多为清华系,且以技术导向为主。 智谱 时间轮次金额估值投资机构投 2024/09 B+轮 数十亿 200亿中关村科学城资 布 2024/03 B+轮 - 美元 - 2024/01 B+轮 - - 2023/10 B+轮 - - 2023/09 B+轮 12亿 25亿 2023/07 B+轮 约3亿 40亿 2023/05 B+轮 约4亿 40亿 2022/09 B轮 约2亿 20亿 2021/09 A轮 约1.5亿 - 2021/04 天使轮 - - 2019/08 种子轮 - - 2024/05 B+轮 约4亿美元 约30亿 Prosperity7Ventures局 顺禧金基 光速光合 发起总额为10亿人民币的大模型创业基金,支持大模型 蚂蚁集团对创业者原始创新,覆盖大模型法算、底层算子、芯片优化、行业大模型和超级应用等各方面。 好未来、小米、红杉、美团、腾讯投资、金山软件、阿里 巴巴、顺为资本、高瓴资本、君联资本分别联合CCF中国计算机学会、中国中文信息学会社会媒 美团 今日资本,蚂蚁金服,光速中国启明创投,君联资本,华控金基 图灵创投、凌云光、华控基金、将门创投、海南智桥、 对学术界 体处理专委会发起了CCF-智谱大模型基金、SMP-智谱大模型交叉学科基金,用于支持大模型理论、算法、模型、 应用等相关研究和跨领域交叉创新。 IMOVentures、达晨财智、北京荣品 成立大模型开源计金基用,计划累 1000张GPU、 北京创新智源 科技有限公司 中科创、星华控技术转移有限公司、清控资管集团 对开社源区 1000万人民币和1000亿tokens来支持人工智能开建区社源。设 信息来源:智谱、相关报道及公开信息整理 智谱AI——团队:学院派代表,清华计算机系人才众多 依托清华AI人才资源:截至2024年9月,公司员工共计600余人,其中大模型研发人员接近半数,其余为客户服务落地人员及产人品员。公司借助清华系高校背景,持续吸引高端人才。 团队具备从研发到落地全栈能力:公司团队源自清华知识工程研究室KEG,该实验室自90年代成立起就走的是“科研+工程化落地”路线,团队成员具备深厚技术积累及综合运营经验;创始人唐杰教授认是知智能领域顶尖专家,具备20余年人工智能领域研究经验。 唐杰 创始人技术顾问 张鹏 CEO 张帆 COO 清华大学计算机清科华学计与算机技系术本工硕学博博,士中、国I新EE闻EF信e息llo标w准化分会委员机硕士、法国梅斯大学计算机硕巴士黎第十一大学计算 清华大学计算机系教授,研究方向知识图谱电子学会标准化工作委员会机器人技术委员会委员 曾主导开发全球最大万亿级超大规模预训练模型悟道在ICML、ISWC等顶级会议上发表10余篇文章 曾任大搜车集团CTO,曾创立元因智能任CEO,创立妙计旅行任CEO,智是能技术领域连续创业者 曾在字节,腾讯,搜狗从事技术管理工作 王绍兰总裁 曾任清华数据科学研究院科技大数据研究中心副主任 凹凸科技北京公司总经理 获得授权发明专利15项,美国发明专利2项 信息来源:智谱及公开信息整理 刘德兵董事长 20余年技术和政府项目综合经验 清华数据科学研究院科技大数据研究中心副主任 中科院计所算博士,师从高文院士 获得授权发明专利40余项,国际标准一项 MiniMax——模型:选择混合专家架构技术路径,打造多模态模型 国内最早研发MoE及LinearAttention:2023年6月,MiniMax在MoE混合专家架构仍是行业非共识时选择AllinMoE,彼时行业大部分公司仍在训练Dense稠密模型。2024年1月,MiniMax发布千亿参数MoE架构模型;4月底,推出万亿参数MoE架构模型。即将发布的abab7模型将基于MOE+LinearAttention。 围绕产需品求打造全矩阵多模态模型:截至2024年9月,MiniMax已推出视频大模型、音乐大模型及语音大模型,最新主力模型abab6.5在多项核心能力上开始接近世界最领先大语言模型水平。 模Dense •由自注意力机制层( SA)和前馈神经网络层(FFN)组成,每 一层都与前层直接相模 连。型 •每次前向传播中所有矩 的参数都被激活和使阵 用,需要的计算量和 视频大模型音乐大模型语音大模型单日交互次数 30亿次 abab-video-1abab-music-1abab-speech-1 日均处理 Tokens 压缩率高、文本响应好、支持多功能端到端音乐生支持粤语、韩语、⻄班牙 风格多样,支持原生高分成,可合成多种音乐形式,语等多语种,生成语句超 型稠密模型 架构对比 显存更大。 •自注意力机制层(SA)后接了多个前馈神经 网络层(FFN)。主 •在每次前向传播中,流 由路由机制选择性激测 活部分FFN。试 •可减少计算量和显存集 辨率、高帧率视频 支持伴奏人声同时生成拟人,情绪细腻自然 3万亿 abab6.5系列包含两个模型:abab6.5和abab6.5s。在各类核心能力测试中,abab6.5开始接近GPT-4、Claude-3、Gemini-1.5等世界上最领 MoE 混合专家模型 需求,同时提高模型 在同等条件下的灵活性和容量。 成先的大语言模型。 绩 源 信息来源:MiniMax及公开信息整理 MiniMax——应用:以娱乐陪伴方向为主,专注打造超级应用 ToC打造超级应用工厂:MiniMax是国内创业