前言 伴随人工智能技术的加速演进,AI大模型已成为全球科技竞争的新高地、未来产业的新赛道、经济发展的新引擎,发展潜力大、应用前景广。近年来,我国高度重视人工智能的发展,将其上升为国家战略,出台一系列扶持政策和规划,为AI大模型产业发展创造了良好的环境。当前,通用大模型、行业大模型、端侧大模型如雨后春笋般涌现,大模型产业的应用落地将进一步提速。作为新一代人工智能产业的核心驱动力,AI大模型广泛赋能我国经济社会的多个领域,打开迈向通用人工智能的大门,推动新一轮的科技革命与产业变革。在大模型盛行的时代,产业发展到何种阶段,遇到何种挑战,未来将走向何方,这些都是需要面对的问题,亟需社会各界共同努力。 在此背景下,人民网财经研究院、至顶科技联合发布《开启智能新时代:2024年中国AI大模型产业发展报告》,报告对于AI大模型产业发展背景、产业发展现状、典型案例、挑战及未来趋势等方面进行了系统全面的梳理,为政府部门、行业从业者以及社会公众更好了解AI大模型产业提供参考。 专家寄语 2023年人工智能大模型全面爆发,给科技创新、生产生活带来重大变革、机遇和挑战。全球大模型竞争日趋激烈,众多国产大模型脱颖而出。大模型与电力、零售、出版等传统行业的成功融合,展现对传统产业改造提升的潜力。大模型赋能金融、医疗等行业提质增效,对推动新质生产力快速发展起到重要作用。大模型持续健康发展,需要政策法规保驾护航,满足隐私保护、数据安全等多方面要求。期待未来大模型持续深耕技术创新并服务于各行各业,为全社会全方位地注入高质量发展的新动能。 李君传播内容认知全国重点实验室专职副主任 AI大模型的出现,使得利用人工智能技术来生成内容,从“可用”跨越到“好用”。生产内容是所有行业共有的需求,如今大模型已经在电商、影视、传媒等领域被规模应用。大模型的商业化需要供需双方同时发力:供给侧来看,以Transformer为代表的根技术存在显著成本问题,当前大模型还有进一步压缩成本、提高性价比的空间;需求侧来看,企业高效应用AI大模型的必然前提是,投入大量资金、人力、时间以提升企业自身数字化程度。未来,人工智能生成内容从“好用”到“高效”,也许会再经历一次或多次技术范式的颠覆。 王蕴韬中国信息通信研究院人工智能研究中心副总工程师 2024年,多重利好因素将推动大模型快速发展,首先是“人工智能+”行动等来自政府层面的有力支持,其次用户提升生活、工作效率的需求激增,再加上科技公司加大对AI领域投入资金、人力、技术研发,各环节协同支撑大模型发展。当前大模型产业也面临挑战,包括算力分散不足、Transformer结构是否为最优的疑问、领域数据稀缺、缺少现象级应用的问题。就产业趋势而言,投入基础模型训练的公司未来可能会大幅减少,转而更多的公司会去寻找应用场景和爆款应用。vivo结合自研大模型端侧化、矩阵化的技术优势并且会聚焦手机行业的应用经验,利用大模型重构手机各类功能,找到落地场景,普惠更多用户。 周围vivo副总裁、vivoAI全球研究院院长 目录 第一章扬帆起航:中国AI大模型产业发展背景1 1.1中国AI大模型产业发展政策驱动力1 1.2AI大模型产业发展技术驱动力4 1.3中国AI大模型产业发展市场驱动力9 第二章百舸争流:中国AI大模型产业现状及典型案例12 2.1AI大模型主要特征12 2.2AI大模型主要类型13 2.3中国AI通用大模型典型案例15 2.4中国AI行业大模型典型案例20 2.5中国AI端云结合大模型典型案例27 第三章大浪淘沙:中国AI大模型产业发展所面临的挑战31 3.1大模型产业遭遇算力瓶颈31 3.2主流大模型架构仍存在诸多局限31 3.3高质量的训练数据集仍需扩展32 3.4大模型爆款应用尚未出现32 第四章天阔云高:中国AI大模型产业趋势展望34 4.1AI云侧与端侧大模型满足不同需求,C端用户将成为端侧的主要客群34 4.2AI大模型趋于通用化与专用化,垂直行业将是大模型的主战场34 4.3AI大模型将广泛开源,小型开发者可调用大模型能力提升开发效率35 4.4AI高性能芯片不断升级,AI大模型产业生态体系将不断完善36 结语37 AI大模型将加快新质生产力发展,助力我国经济社会高质量发展37 第一章扬帆起航:中国AI大模型产业发展背景 1.1中国AI大模型产业发展政策驱动力 近年来,我国始终高度重视人工智能发展机遇和顶层设计,发布多项人工智能支持政策,国务院于2017年发布《新一代人工智能发展规划》。科技部等六部门也于2022年印发《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》对规划进行落实。2024年《政府工作报告》中提出开展“人工智能+”行动。伴随人工智能领域中大模型技术的快速发展,我国各地方政府出台相关支持政策,加快大模型产业的持续发展。当前,北京、深圳、杭州、成都、福建、安徽、上海、广东等地均发布了关于AI大模型的相关政策。具体来看,北京着力推动大模型相关技术创新,构建高效协同的大模型技术产业生态;上海强调打造具备国际竞争力的大模型;深圳重点支持打造基于国内外芯片和算法的开源通用大模型,支持重点企业持续研发和迭代商用通用大模型;安徽从资源方面着手吸引大模型企业入驻;成都着力推动大模型相关技术创新,重点研发和迭代CV大模型、NLP大模型、多模态大模型等领域大模型以及医疗、金融、商务、交通等行业大模型;杭州支持头部企业开展多模态通用大模型关键技术攻关、中小企业深耕垂直领域做精专用模型。 2023年以来我国各地出台的大模型产业相关政策 发布时间 发布机构 政策标题 政策内容 支持创新主体重点突破分布式高效深度学习框架、大模型新 《北京市加快建设 型基础架构等基础平台技术。着力推动大模型相关技术创 具有全球影响力的 新。构建高效协同的大模型技术产业生态。建设大模型算法 北京市 2023年5月 人工智能创新策源 及工具开源开放平台,构建完整大模型技术创新体系。组建 人民政府 地实施方案 全栈国产化人工智能创新联合体,搭建基于国产软硬件的人 (2023-2025年)》 工智能训练和服务基础设施,研发全栈国产化的生成式大模型,逐步形成自主可控的人工智能技术体系和产业生态。 高效推动新增算力基础设施建设:加快推动海淀区、朝阳区建设北京人工智能公共算力中心、北京数字经济算力中心,形成规模化先进算力供给能力,支撑千亿级参数量的大型语言模型、大型视觉模型、多模态大模型、科学计算大模型、大规模精细神经网络模拟仿真模型、 《北京市促进通用 北京市人民政 脑启发神经网络等研发。 2023年5月 人工智能创新发展 府办公厅 开展大模型创新算法及关键技术研究: 的若干措施》 围绕模型构建、训练、调优对齐、推理部署等环节,积极探索基础模型架构创新,研究大模型高效并行训练技术和认知推理、指令学习、人类意图对齐等调优方法,研发支持百亿参数模型推理的高效压缩和端侧部署技术,形成完整高效的技术体系,鼓励开源技术生态建设。 《深圳市加快推动 重点支持打造基于国内外芯片和算法的开源通用大模型;支 中共深圳市委 人工智能高质量发 持重点企业持续研发和迭代商用通用大模型;鼓励大模型企 办公厅、深圳 2023年5月 展高水平应用行动 业联合生态伙伴加强大模型插件及相关软硬件研发,推动大 市人民政府办 方案(2023—2024 模型与现有的操作系统、软件、智能硬件打通、互嵌。 公厅 年)》 到2025年,基本形成“高算力+强算法+大数据”的产业生态,将我市打造成为全国算力成本洼地、模型输出源地、数据共享高地,人工智能创新应用水平全国领先、国际先进。 《杭州市人民政府 算力设施先进泛在,算力供给普惠高效,全市可开放算力规 办公厅关于加快推 模在使用半精度输出输入(FP16)下达到5000千万亿次浮点 杭州市人民政 2023年7月 进人工智能产业创 指令/秒(PFLOPS)以上,高性能算力占比达到60%以上。模型 府办公厅 新发展的实施意 创新应用领跑全国,培育性能达到国际先进水平的通用大模 见》 型1个、具有行业重大影响力的专用模型10个。支持头部企业开展多模态通用大模型关键技术攻关、中小企业深耕垂直领域做精专用模型,鼓励相关技术和算法开源开放,形成“1+N+X”的协同创新、双向赋能产业生态。 2023年8月 成都市经济和 《成都市加快大模 支持企业与科研机构开展数据与知识深度联合学习、大规模 信息化局、成都市新经济发展委员会 型创新应用推进人工智能产业高质量发展的若干措施》 认知与推理、可控内容生成等关键算法研发,着力推动大模型相关技术创新,重点研发和迭代CV大模型、NLP大模型、多模态大模型等领域大模型,以及医疗、金融、商务、交通等行业大模型。 《福建省人民政府 以普惠算力降低人工智能企业研发成本,支撑快速增长的算 办公厅关于印发福 力需求,促进自然语言,多模态认知等超大规模智能模型开 福建省人民政 2023年9月 建省促进人工智能 发训练。 府办公厅 产业发展十条措施的通知》《安徽省人民政府 对在皖落户的通用及行业大模型企业、跨领域应用企业、新 关于印发打造通用 兴算力企业、安全人工智能企业等,优先匹配算力、数据、 安徽省 2023年10月 人工智能产业创新 场景、基金、场地等要素资源。 人民政府 和应用高地若干政策的通知》《上海市推动人工 实施大模型创新扶持计划。支持引进高水平创新企业,支持 上海市经济和 智能大模型创新发 本市创新主体打造具有国际竞争力的大模型,鼓励形成数据 信息化委员 展若干措施 飞轮,加速模型迭代,对取得重大成果的予以专项奖励。实 2023年10月 会、上海市发 (2023-2025年)》 施大模型示范应用推进计划。重点支持在智能制造、生物医 展和改革委员 药、集成电路、智能化教育教学、科技金融、设计创意、自 会等五部门 动驾驶、机器人、数字政府等领域构建示范应用场景,打造标杆性大模型产品和服务。 《广东省人民政府 围绕基础架构、训练算法、调优对齐、推理部署等环节,研 关于加快建设通用 发千亿级参数的人工智能通用大模型,形成自主可控的大模 广东省 2023年11月 人工智能产业创新 型完整技术体系。聚焦智能经济、智能社会等行业创新场景, 人民政府 引领地的实施意 研发具有多模态数据、知识深度融合的垂直领域大模型,支 见》 撑多任务复杂场景行业应用。 制表:报告组根据公开信息整理 1.2AI大模型产业发展技术驱动力 近年来,AI大模型得到快速发展,当前大模型热潮主要由语言大模型相关技术引领。语言大模型通过在海量无标注数据上进行大规模预训练,让模型学习大量知识并进行指令微调,从而获得面向多任务的通用求解能力。2017年,Google提出基于自注意力机制的神经网络结构——Transformer架构,奠定了大模型预训练算法架构的基础。2018年,OpenAI和Google分别发布了GPT-1与BERT大模型,预训练大模型成为自然语言处理领域的主流。2022年,OpenAI推出ChatGPT,其拥有强大的自然语言交互与生成能力。2023年,OpenAI多模态预训练大模型GPT-4发布,其具备多模态理解与多类型内容生成能力。2024年,OpenAI发布视频生成大模型Sora,提出时空碎片和扩散Transformer技术,大模型的多模态生成能力的进一步成熟。本部分将从经典Transformer架构出发,通过全面梳理基于人类反馈强化学习、指令微调、提示学习等相关大模型技术,体现技术对于产业发展的带动作用。 1.2.1Transformer架构 Transformer架构是目前语言大模型采用的主流架构,于2017年由Google提出,其主要思想是通过自注意力机制获取输入序列的全局信息,并将这些信息通过网络层进行传递,Transformer架构的优势在于特征提取能力和并行计算效率。 Transformer架构主要由输入部分、多层编码器、多层解码器以及输出部分组成。其中,输入部分包括源文本嵌入