AI现状:中国 人工分析 Q12025 中国AI实验室逐渐赶上美国AI实验室;来自中国实验室的模型随着DeepSeek的R1模型的发布,现在正在接近o1级智能 美国和中国:随着时间的推移,前沿语言模型情报1 索引1人工分析智能 95 90USAOpenAIo1 中国OpenAIo1preview 85 人类克劳德 80十四行诗6月24日 OpenAIo32 DeepSeekR1 主要趋势 75OpenAI,GPTOp4enAI,GPT4Turbo GPT4o DeepSeekV3 70 65 60 55 50OpenAI,GPT35Turbo 45 40 阿里巴巴,Qwen2指导72B阿里巴巴,Qwen25指令72 推理模型很快变得司空见惯:推理模型(在回答前进行“思考”的模型)最早由OpenAI在2024年第三季度引入。几个月内,以DeepSeek为代表的中国竞争对手已基本复制了o1的智能水平。目前,多家中国AI实验室已经拥有前沿级别的推理模型。 DeepSeekV2阿里巴巴,Qwen聊天372B 35阿里巴巴,Qwen聊天37B 在前沿实验室附近打开模型:由DeepSeek和阿里巴巴领导的开放权重模型已经接近o1级智能。 30 25 20 15 4Q221Q232Q233Q23 4Q231Q24 模型发布日期 2Q243Q244Q241Q252Q25 缩小差距:2024年最后几个月见证了多家顶尖中国AI实验室推出众多高性能模型。这导致了中国AI实验室与美国AI实验室在智能水平上的差距缩小。目前,一些中国模型已与美国顶级实验室的模型竞争。 B 1人工分析智能指数:涵盖一系列语言模型智能和推理评估数据集的平均值。目前包括MMLU、GPQADiamond、MATH500及HumanEval。发布日期基于该模型的首次公开发布。2o3智能指数通过放大测量的o1的智能指数估算得出。3基于公司声明和可比结果估算。 在可用的情况下,尚未通过人工分析进行独立基准测试 自2023年初推出OpenAIGPT4以来,美国领先AI实验室已经争先恐后赶上OpenAI 竞争实验室赶上OpenAIGPT4:OpenAI于2022年11月通过推出ChatGPT中GPT35开启了语言模型竞争;美国领先实验室已基本赶上OpenAI前沿模型。 24日 随着时间推移,美国领先AI实验室前沿语言模型智能1 主要趋势 索引1人工分析智能 95 OpenAI 90人类 85 o1预览双子座15Pro o3o13 Google 80Meta 75 70 GPT4 克劳德35Sep‘24 十四行诗6月24日 GPT4TurboGPT4o 双子座15Pro24年5月 Gemini10Ultra Gemini20闪存 克劳德35十四行诗10月美洲驼33 BigTech关闭了前沿实验室:Google和Meta 模型正迅速逼近前沿模型,其中Gemini20Flash超过了Claude35Sonnet和GPT4o能力。 70B美洲驼31 65 60 55 50GPT35Turbo PaLM22L 克劳德212 克劳德3Opus GPT4以外智能火花:2024年最后几个月见证了除了GPT4之外重大智能飞跃,由OpenAIo3引领。推理模型、数据质量以及新强化学习技术等主题已与预训练计算扩展一起成为提升模型性能主要杠杆。 Llama3说明70B 405B 45克劳德12 40 35 30 25美洲驼652B 20 15 Llama2聊天702B 4Q221Q232Q233Q23 4Q231Q24 模型发布日期 2Q243Q244Q241Q252Q25 1人工智能分析指数:涵盖了多种语言模型智能和推理评估数据集平均值。目前包括MMLU、GPQADiamond、MATH500及HumanEval。发布日期基于该模型第一次公开发布。2估计依据公司声明和可比结果(如有),尚未由ArtificialAnalysis独立基准测试。 3o3智力指数通过缩放测量智力得分o1来估计。 领先人工智能实验室DeepSeek和阿里云(Alibaba)持续发布新模型,在2024年底,DeepSeek超越了阿里云。 随着时间推移,中国领先AI实验室语言模型智能1 主要趋势 DeepSeek 阿里巴巴 DeepSeekR1 DeepSeekV3 Qwen Qwen25指令72B DeepSeek Qwen2指示72B DeepSeekV2 Qwen聊天72B2 DeepSeekV21 Qwen聊天7B2 索引1人工分析智能 95 90 85 80 75 70 65 60 55 50 45 40 35 30 25 20 15 4Q221Q232Q233Q23 4Q231Q24 模型发布日期 25MaxV25 领先开放式重量模型:中国人工智能实验室 ,包括阿里云、深视和腾讯,发布了开放权重前沿模型,这些模型在全球领先模型中具有竞争力。 迅速提高智力:尽管中国AI实验室较晚加入AI竞赛,但在2024年,它们在智能方面与前沿美国模型之间差距显著缩小。当OpenAI推出o1时 ,中国实验室在几个月内开发出了一个性能相当 模型(DeepSeekR1)。 2025年潜在领导者:2025年初,包括阿里云 、深视、明略、腾讯、智谱和通义等中国人工智能实验室纷纷发布了前沿推理模型。发布速度和频率表明,中国人工智能实验室在2025年已不再是落后者。 2Q243Q244Q241Q252Q25 1人工分析智能指数:涵盖一系列语言模型智能和推理评估数据集平均值。目前包括MMLU、GPQADiamond、MATH500及HumanEval。发布日期基于模型首次公开发布。 2基于公司声明及可比结果进行估算,尚未由人工分析独立基准测试。 在美国继续在情报前沿领域保持总体领先地位同时,中国与之距离已不再遥远 。很少有其他国家能够展示出同等水平训练能力。 语言模式前沿:起源国 人工分析智能指数,精选领先模型2025年初,非详尽 94 90 89 89 USA 中国 法国 加拿大 以色列 84 82 82 81 80 79 79 78 77 76 75 74 74 72 72 64 55 o3o1R1,o3mini,o1mini,Step2GeminiGeminiClaudeV3,阿里巴巴GPT4oQwen25MiniMaxNovaPro,Llama33Large2V2512月 Grok 15大,命令 OpenAI1 OpenAIDeepSeekOpenAIOpenAI16k、20Flash15Pro35DeepSeekQwen258月24日、InstructText01、AmazonInstruct11月24日、24、StepFun经验9月24日,十四行诗MaxOpenAI72BMiniMax70BMetaMistralDeepSeek 心理,谷歌10月24日,阿里巴巴阿里巴巴Google人类 BetaGrok JambaRAI21实验室凝聚 1根据公司声明和可用类似结果估算得出,尚未经过人工分析独立基准测试。 2由于访问限制或评估数据有限,排除了部分中国AI实验室领先模型。 截至2025年初,几家中国人工智能实验室已展示或声称达到了前沿水平智能,其中七家发布了具备推理能力模型。 语言模型前沿:中国AI实验室模型 人工分析智能指数,领先模型2025年初,非详尽 94 89 最高智能美国推理模型 美国最高智能非推理模型 87 84 83 82 82 81 80 79 79 78 77 76 74 73 73 70 65 52 o3 R1Kimik15步骤RM1步骤2 双子座GLM豆宝15V3,Qwen QwQ豆宝15MiniMaxHunyuanErnie40Yi GLM4TurboV1128k OpenAI DeepSeekMoonshot1迷你,预览,16k, 20闪存零ProDeepSeek25Max 阿里巴巴精简版Text01大涡轮闪电 4百川 1月拍1 StepFun1百川 1StepFun Expery预览字节跳动1 阿里巴巴 字节跳动 1MiniMax腾讯 1百度1 YiA1I Plus 心理,智普1 Google 智浦1 1本估计基于公司声明及可比结果(尚未由ArtificialAnalysis进行独立基准比较)。 领先中国大型科技公司积极参与人工智能竞赛,并发布了多种类型AI语言模型及其他模态模型。 非穷尽 百度 中国大型科技公司前沿模型 阿里巴巴 大型电子商务中国最大搜索母公司 字节跳动 华为 腾讯 其他有AI野心公司 昆仑科技SHE:300418市值:60美元1 基于北京互联网集团,拥有超过3亿月活跃用户(MAU);该集团是Opera浏览器所有者。推出了SkyWork系列模型和AI加速器。 360安全奇虎360 SHA:601360市值:11 中国最大互联网B和1移动安全产品提供商推出了360AI品牌Zhinao系列模型。 科大讯飞 SHE:002230市值:16 中国领先语音BAI公1司,拥有超过14000名员工。推出Spark系列模型 美团 香港:3690市值:115中国领先购物平亿台美,元日1活跃用户超过600万 。联合创始人王慧文回归领导AI项目。投资多 家前沿AI实验室。 小米 香港:1810市值上限:1中国领先消费电23子亿品美牌元推出1了MiLM系列小型 型号。最近挖来了DeepSeek研究员罗浮利,负责AI实验室。投资了多个前沿AI实验室。 Riot母公司 打开权重LLM Description 播放器和Hyperscalerengine,以及抖音TikTok和 (阿里云,文信义言,一个AI头条,中国最大股东聊天机器人与报告主要新闻蚂蚁集团300m用户应用程序 全球电信领导者,游戏和微信,世界上“多合一”超级之一 最大智能手机中国APP; 制造商Hyperscaler与他们腾讯云产品 AI战略 (高级 释放打开 积极整合开发专有开发权重模型释放打开 最近专有模型模型和专有权重模型和 已启动集成到搜索平台中特定域提供专有 专有模型长期领先于消费者模型和腾讯模型上报价 最佳LLM4 非推理 Qwen25 情报:79 Max Ernie40 情报:76 Turbo 5 豆宝15Lite盘古50 情报:775 大 浑源大 情报:74 推理 情报: QwQ78 5 豆宝15Pro 情报:805 其他型号 文本到语音 演讲到演讲 图像生成 视频生成 3D生成 提供推论自动驾驶AI平台华为云云阿里云 主要消费者 估价美元235B132B1300B2128B3469B1 Apps 同义千文 文心一燕文心一格 豆宝西莉亚元宝元琪 1根据路透社(2025年1月31日)数据,市值。 2ByteDance是一家私营公司。估值由路透社提供。 3华为是一家私营公司。估值由路透社(2023年)提供。 在中国大型科技公司和中国支持下,中国AI初创公司 政府,已经开发了一些世界领先开放重量模型非穷尽 01AI DeepSeek 智浦 百川 StSeteppffuunn 中国AI老虎和初创企业前沿模型 打开权重LLM 国家支持实体 MoonShotAI Description 中国AI虎和Talkie出版商AI应用程th序mos4t 在美国下载 中国AI老虎2M中文 字符上下文 窗口模型 中国最好 中国AI初创公司专注于较小 语言模型 由 李开复作者, 中国AI实验室起源于 以AI为中心 定量 中国AI老虎近700k企业和 中国AI虎与专注于医疗AI建立模型 王小川 第一个中国AI启动开发一个万亿参数 模型由 姜大新前 1H24 资助AI启动 前负责人 贸易公司 开