2024年第1季度 中国⼤模型季度监测报告 1 ⽬录 CONTENT 01AI技术迭代与政策⽀持加速⾏业转型 02⼤模型的新进展与突破 03AIGC写作及PPT制作产品测评洞察 AI技术迭代与政策⽀持加速⾏业转型 •在⾏业层⾯上,本季度OpenAI、NIVIDA等⾏业巨头从基础设施到上层应⽤均在迅速迭代技术,并扩展应⽤⾏业范围。 2024年第⼀季度⼤模型相关⾏业重⼤事件 ⽂⽣视频⼤模型 OpenAI发布⽂⽣视频⼤模型Sora; Sora可以根据⽂本提示⽣成 ⻓达60秒的视频,同时有着 ⾼度丰富且饱满的背景与细节。 基础设施 NVIDIA在GTC发布Blackwell架构的新款GPU,并升级了软件服务; 同时,NVIDA向⼈形机器⼈、汽⻋、医药等多个⾏业扩展AI应⽤范围。 ⼤模型迭代 Anthropic发布新⼀代⼤模型系列Claude3; 其在多个关键领域的表现已经显著超越了包括GPT-4在内的现有顶级⼤模型。 《“数据要素×”三年⾏动计划(2024—2026年)》 新增国家级政策⼤模型相关具体内容 支持开展人工智能大模型开发和训练 《⼯业和信息化部等七部⻔关于推动未来产业创新发展的实施意⻅》 加速类脑智能、群体智能、⼤模型等深度赋能,加速培育智能产业。 《政府⼯作报告》 深化大数据、人工智能等研发应用,开展“人工智能 +”行动,打造具有国际竞争力的数字产业集群 2024年第⼀季度⼤模型地⽅相关政策发布情况2024年第⼀季度地⽅新发布⼤模型相关政策 2024年1-2⽉北京市《北京市加快商业航天创新发展⾏动⽅案( ⿊⻰江 吉林 辽宁 内蒙古 北京 宁 河北天津 2024-2028年)等 2024年3⽉宁夏回族⾃治区《宁夏回族⾃治区全⾯推进“⾼效办成⼀件事”进⼀步提⾼⾏政⼯作质效实施⽅案》 新疆 ⽢肃 ⻘海夏 ⻄藏 四川 陕⼭⻄⼭东 ⻄ 河南 安 湖北徽 2024年1⽉⼭东省《中共⼭东省委⼭东省⼈⺠政府关于加快数字经济⾼质量发展的意⻅》 江苏 上海 2024年1-2⽉上海市《关于印发⽀持浦东新区等五个重点区域打造⽣产性互联⽹服务平台集聚区若⼲措施的通知》等 重庆浙江 江 湖南 2024年1⽉浙江省《浙江省⼈⺠政府办公厅关于加快⼈⼯智能产业发展 的指导意⻅》 已发布5项以上相关政策 已发布2-4项相关政策 已发布1项相关政策暂未发布相关政策 贵州⻄福建 ⼴⻄⼴东 台湾 云南 ⾹港澳⻔ 海南 钓⻥岛 ⾚尾屿 南海诸岛 2024年2⽉贵州省《2024年〈政府⼯作报告〉重点⼯作责任分⼯⽅案》 数据来源:InfoQ研究中⼼根据各省市政府官⽹、政府公⽂等公开渠道整理 2024.2.19 国务院国资委召开中央企业人工 2024.3.4-3.112024.3.24 中国发展高层论坛 2024年全国两会 智能专题推进会 •会议认为,加快推动人工智能发展,是国资央企发挥功能使命,抢抓战略机遇,培育新质生产力,推进高质量发展的必然要求; •会议强调,中央企业要把发展人工智能放在全局工作中统筹谋划,深入推进产业焕新,加快布局和发展人工智能产业。 •人工智能在全国两会中成为 焦点话题之一。“人工智能+”在我国政府工作报告中第一 次被提出,意在鼓励各行各业重视人工智能技术的应用和落地,象征着人工智能正在成为产业创新的关键抓手和驱动新质生产力的关键引擎。 国务院发展研究中心主办 •中国发展高层论坛将人工智能AI作为重要议题。人工智能将成为第四次工业革命的标配,中国政府高度重视人工智能发展,通过加强人工智能领域科技创新、推动人工智能深度赋能实体经济、推进人工智能伦理治理等方面发展。 随着人工智能得到高度重视,政府机构、央国企和高效或科研机构纷纷开始行动,例如在2024年第一季度陆续成立智算中心,为各类创新主体提供普适普惠的算力服务。 •随着⼈⼯智能技术的快速发展和应⽤场景的不断拓展,对于AI算⼒、数据服务和云服务等基础设施的需求⽇益增⻓。商汤科技智能产业研究院与中国信息通信研究院云计算与⼤数据研究所、中国智能算⼒产业联盟、⼈⼯智能算⼒产业⽣态联盟联合发布的《新⼀代⼈⼯智能基础设施⽩⽪书》显示,过去四年,⼤模型参数量以年均400%复合增⻓,AI算⼒需求增⻓超过15万倍,远超摩尔定律。 •智能算⼒成为AI产业发展的关键⽀撑要素,但在资源上仍然存在⽋缺,这促使政府、企业和研究机构正在积极采取措施,加快建设来满⾜市场需求。IDC预测,中国智能算⼒规模预计到2027年将达到1117.4EFLOPS,2022⾄2027年期间,中国智能算⼒规模年复合增⻓率达33.9%,同期通⽤算⼒规模年复合增⻓ 率为16.6%。 InfoQ研究中⼼调研显示,⽣成式AI开发者表示企业AI研发 ⼯作普遍存在GPU资源紧张,算⼒不⾜问题。解决算⼒资源不⾜成为11.0%的开发者最希望解决的问题。 % “算⼒太贵,训练研发周期⻓,成品收益不明显”“因为算⼒的原因,⽆法使⽤更⼤规模的模型”“算⼒不⾜,模型调优进度慢,赶不上业界变化”“私有部署模型,算⼒成本巨⼤,且⽆法很好满 ⾜⽤户并发需求” 11.0 数据来源:InfoQ2023年12⽉发起的《中国⽣成式AI开发者画像调研》https://www.infoq.cn 7 •国资委召开“AI赋能产业焕新”中央企业⼈ 2 ⼯智能专题推进会,要求央企重点关注算 ⼒基础设施构建与多模态产业赋能 1 要夯实发展基础底座,把主要资源集中投⼊到最需要、最有优势的领域,加快建设⼀批智能算⼒中⼼,进⼀步深化开放合作,更好发挥跨央企协同创新平台作⽤ 开展AI+专项⾏动,强化需求牵引,加快重点⾏业赋能,构建⼀批产业多模态优质数据集,打造从基础设施、算法⼯具、智能平台到解决⽅案的⼤模型赋能产业⽣态 8 中国联通 •致⼒打造算⼒丰富、运⼒充沛、多云协同、算⽹⼀体的算⼒精品⽹,规划主包括三⽅⾯: •丰富多级算⼒供给,完善多级架构; •提升算⼒输送⽹能⼒,筑牢超强运⼒、智能开放的全光传送底座;优化⽹络架构布局,构建东数⻄算低时延平⾯; •优化算⽹调度体系。 国铁集团 •借助华为云铁路⼤模型“训练”TFDS系统,将⼈⼯检⻋升级为“AI检⻋”系统,实现了以铁路货⻋拦停重点故障为主的380+余种故障的智能识别,效率更⾼、可靠性更强,⽬前已从郑州北⻋辆段试点逐步推 ⼴到全国多个路局试⽤。 国家电网 •通过应⽤百度⼤模型技术,实现AI预测⽤电的⾼峰波⾕,为电⽹调度提供建议,⽤智能巡检减少安全隐患,保障供电平稳。 山东能源集团 •联合华为云发布盘古矿⼭⼤模型和最佳实践⽩⽪书,并将其应⽤于采煤、掘进、主运、辅运、提升、安监、防冲、洗选、焦化等9个专业40多个应⽤场景,持续改善煤矿⼯⼈作业环境,减少安全事故,提升⽣产质量。 鄂尔多斯市创新投资集团 •与华为共同打造⾸个以盘古⼤模型为核⼼的⼯业互联⽹平台,以AI和矿鸿为核⼼,包含有智算算⼒、矿⼭⼤模型、多个预置算法以及应⽤开发环境等全套能⼒,开放普惠给产业链伙伴,以此解决AI开发⻔槛⾼、周期⻓等难题。 ⼤模型的新进展与突破 •2⽉16⽇,OpenAI发布的⽂⽣视频⼤模型Sora。Sora凭借其连贯流畅并细节饱满的视频⽣成能⼒与⻓达60秒的⽣成视频时⻓,给市 ⾯上已有的⽂⽣视频模型带来了降维打击的同时,也宣布了⽂⽣图⼤模型的发展进⼊新篇章。 •各⼤媒体与互联⽹平台迎来⼀波Sora流量⾼峰。 •官⽅媒体:央⼴⽹、央视财经⽹等官⽅媒体也对Sora进⾏了报道。 •证券研报:平安证券、国盛证券、⺠⽣证券等券商纷纷发布Sora相关技术与产业链等不同⻆度研报进⾏解读。 •专家解读:各⾏业专家从技术、⾏业影响、投资价值等各个⻆ 度对Sora进⾏讨论与解读。 百度搜索指数 微信指数 140,305 231,682,175 Sora⼤模型⽕爆出圈Sora⼤模型多⽅⾯领先已有⽂⽣视频⼤模型 ⽣成视频时⻓ 以往⽂⽣视频⼤模型 2-3秒 10-20倍 Sora⼤模型 60秒 分辨率 ⽂⽣视频⼤模型普遍维持在 1280*720 Sora⼤模型分辨率达到 1920*1080 •Sora在运动连贯度、背景细致程度、真实度等⽅⾯表现亮眼。但是,最值得关注的点为⽣成视频时⻓与分辨率。 备注: 1.图⽚仅为展示不同分辨率效果。 国内发展⽂⽣视频⼤模型的⼟壤肥沃 •已经具备⼀定研发技术能⼒,需要在多个维度进⾏技术更新和迭代。 •包括提⾼⽣成视频的分辨率、 优化背景清晰度与丰富度、⻆ ⾊的多样性、同⼀物体不同镜头连贯程度、画⾯真实性以及 ⽣成速度。 •在⽂⽣视频⼤模型的研发和应 ⽤领域,形成了多元的⽣态系统。有阿⾥巴巴、百度、腾讯等在⼤模型⽅⾯有丰富经验积累与丰富的数据资源的互联⽹ ⼤⼚,也有爱诗科技等初创企业。 •政府对于⼈⼯智能技术的发展持积极态度,明确的政策倾向有利于参与研发的企业争取到更多扶持资源。 已有⽂⽣视频⼤模型 ⾏业参与者众多 政策⽀持 国内⽂⽣视频⼤模型 |PixVerse |ModelScopeT2V|UniVG |WHEE |VideoCrafter2|天幕多媒体⼤模型 |PixVerse |CapCupAIVideo •2024年第⼀季度,开源领域的积累主要在多模态和MOE架构两⽅⾯。多模态领域,在Sora发布后,开源领域迅速跟进,复现流程并开源模型,图⽂模型仍然是多模态成果积累的主⼒军。此外,MOE模型因其计算效率的优势⽽在⼀季度⼴受关注,众多知名企业开源MOE模型。 图⽂模型 •1⽉22⽇,零⼀万物开源YiVisionLanguage(Yi-VL ),包括Yi-VL-34B和Yi-VL-6B两个版本 •2⽉1⽇,⾯壁智能开源MiniCPM-V-2.8B和OmniLMM-12B •2⽉6⽇,美团公司及浙江 ⼤学的研究者发布MobileVLMV2视觉语⾔模型 视频⽣成模型 •3⽉18⽇,Colossal-AI团队在推出Sora训练推理复现流程的两周后,开源了类Sora架构视频⽣成模型「Open-Sora1.0」 ⾳乐⽣成模型 •1⽉16⽇,Meta发布MAGnet⽂⽣⾳频/ ⾳乐模型 多模态不仅图⽂,视频⾳频迅速跟进 MOE开源硕果累累,核⼼是计算性能与成本的平衡 •3⽉27⽇,Databricks公司发布了DBRX开源MOE模型,模型包含1320亿参数,16个专家⽹络。 •3⽉28⽇,通义千问团队宣布推出Qwen系列的⾸个MoE模型,Qwen1.5-MoE-A2.7B •3⽉28⽇,以⾊列⼤模型研究机构A21Labs宣布开源MOE模型Jamba。 •⼤模型发展阶段中,关于开闭源发展的路线之争从未停歇,各类⼤咖隔空喊话,仅⼀季度,⻢斯克提诉OpenAI,投资机构创始⼈MarcAndreessen和VinodKhosla之间展开推特⼤战。再到国内近期百度李彦宏、360董事⻓周鸿祎、猎豹移动CEO傅盛的先后发声。不仅如此,各家公司也在⽤实际⾏动,为开闭源路线投票。 •国际⽅⾯,以Mistral-7B引发⼤量关注的MistralAI,在2⽉1⽇发布的MistralLarge也并未开源,加⼊开闭源并⾏发展路线。「OLMo」、NomicEmbed的发布,则是传统开源理念践⾏者迈出的⼀步。两个模型不仅选择开放了模型权重,还包括数据集、训练代码和训练过程。 •国内,在2024年第⼀季度有更新的模型当中,坚持纯开源和纯闭源路线的也是少数,以百川、智谱、通义为代表的开闭源并⾏路线⼤⾏其道。 2024年Q1海外开闭源路线讨论涉及重点模型 2⽉艾伦⼈⼯智能研究所等5机构公布了开源模型「OLMo」 1⽇,开放权重、数据集、训练代码和所⽤⼯具包。 2024年Q1有更新的中国通⽤⼤模型发展路线图纯开源路线开闭源并⾏路线 2⽉ 2⽇ 2⽉ 27⽇ AI初创公司NomicAI推出NomicEmbed,开放权重、数据集、训练代码和训练过程 以开源模型起家的MistralAI