人工智能行业应用建设发展参考架构 国家信息中心公共技术服务部二〇二四年十一月 前言 党中央、国务院高度重视人工智能发展,习近平总书记强调,人工智能是新一轮科技革命和产业变革的重要驱动力量,加快发展新一代人工智能是事关我国能否抓住新一轮科技革命和产业变革机遇的战略问题。贯彻党的二十届三中全会精神,落实2024年政府工作报告关于“深化大数据、人工智能等研发应用,开展‘人工智能+’行动”等工作部署,为充分发挥我国超大规模市场和丰富应用场景优势,以应用为牵引推动人工智能技术与行业深度融合,加快行业应用建设统一架构设计,集中力量打通从模型到应用的落地堵点,降低应用开发验证门槛,提高部署效率,加快形成人工智能规模化应用正成为市场关注的重点。 国家信息中心在深度调研人工智能产业发展现状基础上,聚焦人工智能行业应用发展关键问题,面向制造、交通、金融、医疗、消费等人工智能应用重点行业领域,研究提出《人工智能行业应用建设发展参考架构》报告(以下简称“报告”)。报告从算力基础、数据服务、模型服务、应用开发、运维平台、运营平台等六个方面,提出人工智能行业应用建设的共性能力和特性能力。通过构建一套技术架构统一、数据规范统一、标准体系统一的参考架构,摆脱企业服务模式不同带来的限制,降低供需边际成本,有效发挥规模效应,促进应用创新,激发市场活力,持续推动产业健康高效发展。 本报告旨在研究推进行业应用发展标准化的参考架构,期望为各行业主体明确人工智能应用建设发展的重点和目标,降低应用开发和复制的边际成本,促进人工智能技术的创新成果与产业深度融合,为加快推进人工智能行业应用规模化落地提供有益参考。 主要编写人员: 徐春学、张立峰、宦茂盛、刘飞飞、张润宇、唐露、赵昊楠、张楚妍、史宇萌、张驰 目录 一、人工智能行业应用总体进展1 (一)国内外人工智能行业应用发展现状1 1.全球人工智能技术演进日趋激烈1 2.我国具有独特的发展资源优势3 3.行业应用正成为人工智能竞争的焦点4 (二)人工智能行业应用建设发展模式6 1.自研创新模式6 2.平台赋能模式6 3.两种模式的关系7 (三)推进统一参考架构设计是发展关键7 1.行业应用发展受到多方面挑战7 2.统一架构有利于加速应用规模化落地9 二、人工智能行业应用建设发展统一参考架构9 (一)统一参考架构的内涵与特性10 1.统一参考架构的内涵10 2.统一参考架构的特性11 (二)统一参考架构组成11 1.总体架构11 2.算力基础13 3.数据服务13 4.模型服务14 5.应用开发14 6.运维平台15 7.运营平台15 三、统一参考架构的建设15 (一)统一参考架构技术要求15 1.算力基础15 2.数据服务17 3.模型服务19 4.应用开发21 5.运维平台21 6.运营平台22 (二)基于统一参考架构的应用建设22 1.各服务模式下的建设能力22 2.自研创新模式下的技术架构23 3.平台赋能模式下的技术架构24 四、总结与展望25 一、人工智能行业应用总体进展 (一)国内外人工智能行业应用发展现状 1.全球人工智能技术演进日趋激烈 当前,全球人工智能产业正迎来蓬勃发展的黄金时期。基础技术不断实现突破,产业生态日益成熟,行业应用范围不断拓宽。与此同时,各国政府纷纷出台相关政策,规范行业发展,试图在全球竞争中抢占发展先机。 国外的模型能力、多模态技术、混合模型等基础技术持续演进。一是当前大模型能力快速提升。OpenAI最新发布的o1大模型采用思维链方式对复杂问题进行逐步分析,使得解决多层次 的数学、科学和编码问题成为可能,该模型成为第一个与人类专家能力相当的模型。多模态人工智能技术已经能够综合处理文本、图像、音视频等多种类型的数据,提供更丰富和复杂的服务,例如多模态具身视觉语言模型PaLM-E、文生图模型DALL-E、多模态经典模型CLIP等。注意力机制与其他机制结合的模型能够在降低计算成本和内存占用的同时,保持甚至提高准确性。例如GoogleDeepMind的Griffin模型结合了线性递归和局部注意 力,大大减少了训练时使用的标记数量,依然能保持与Llama-2相当的性能。二是基础技术体系加速收敛。经过十多年的发展沉淀和市场选择,美国AI产业逐渐形成统一收敛的局面,展现出 强大竞争力。在算力(英伟达GPU占比85%以上)、人工智能深度学习框架(PyTorch占比90%以上)、模型(GPT、Llama 系列)等层面,基于收敛的技术栈,吸纳了全球开发者的贡献,形成了强大的生态体系。 国外人工智能产业从芯片、并行计算引擎、人工智能深度学习框架、工具链、开源社区等方面形成了完整的产业链。芯片上,英伟达GPU、谷歌张量处理单元(TPU)等为大规模并行计算提 供支持,英特尔、AMD等则布局多种人工智能专用芯片,满足数据中心、智能终端、自动驾驶等场景的需求。并行计算引擎上,以英伟达CUDA为代表,凭借其丰富的算子生态、强大的社区 支持,成为主导技术。同时,CUDAEULA限制条款要求不允许逆向工程,不允许在非英伟达硬件平台上进行转译运行,进一步 巩固了其产业地位。人工智能深度学习框架上,形成了以Meta 主导的PyTorch和Google主导的TensorFlow为代表的聚集效应。其中,PyTorch是目前全球最流行的人工智能深度学习框架,并结合英伟达GPU芯片底层进行计算优化,占据了90%以上的份 额。开源社区上,国外开源社区聚集效应显著,以全球最大的开 源AI社区HuggingFace为例,吸引了大量的开发者和企业参与,截止2024年11月平台收录超过100万个大小模型和超过 20万个数据集,包括微软、谷歌在内的超过15万家机构使用。 国外人工智能技术应用在医疗医药、自动驾驶、高端制造等行业,并持续拓展应用场景。医疗医药行业,在疾病诊断、药物研发、基因组研究、智能健康监测等方面广泛应用。DeepMind的AlphaFold系列模型专注于蛋白质结构预测,获得2024年诺贝 尔化学奖,这也是首次将该奖项颁给人工智能相关的研究。自动驾驶行业,英伟达的DRIVE平台可进行复杂的路径规划和实时决策,确保自动驾驶汽车的安全行驶。特斯拉FSD系统实现从感知到控制端到端自动驾驶技术在量产车型上的应用已成为现实。高端制造行业,在工业设计、需求预测、过程优化、供应链优化等领域广泛应用。DeepMind的AlphaChip利用了强化学习方法来设计芯片布局,能够在数小时内生成人工需要数周甚至数月的芯片设计工作,并应用于谷歌TPU芯片设计中。 2.我国具有独特的发展资源优势 习近平总书记强调:“中国具有社会主义市场经济的体制优势、超大规模市场的需求优势、产业体系配套完整的供给优势、大量高素质劳动者和企业家的人才优势,经济发展具备强劲的内生动力、韧性、潜力。”中国的市场规模体现在消费者基数大和企业数量多。中国拥有14亿多人口,中等收入群体超过4亿人,连续多年保持世界第二大商品消费市场、世界第一制造业大国、第一货物贸易大国地位,这为各种新技术、新产品提供了广阔的应用场景和市场空间。 中国在全球AI版图中的核心地位日益凸显,其增长潜力不容小觑。根据2024年《全球人工智能和生成式人工智能支出指 南》,中国AI市场规模已由2018年的84亿美元增至2022年的 319亿美元,预计于2027年将达到1,150亿美元,2022年至2027 年的复合年增长率为29.2%。中国AI市场规模占全球AI市场规 模的百分比由2018年的11.9%上升至2022年的16.1%,预计于2027年将达到20.6%。 我国人工智能应用层企业完备,且具备良好的发展势头。根据前瞻产业研究院《2024年中国人工智能行业全景图谱》,在2200家人工智能骨干企业中,提供基础硬件设备和数据服务的 企业仅有53家,从事包括核心算法、开发平台等在内的关键技 术的研发的技术层企业有273家,涉及人工智能技术的集成和场景应用的应用层企业占比高达85.18%,达到1873家。 人工智能技术在互联网领域中的应用尤为活跃,并且正积极 应用于实体经济产业中。一是各行业人工智能应用分多个波次发展。互联网头部企业作为智能化先锋,主导AI技术的研发和应用。运营商、金融、汽车、手机和政府服务类处于第二梯队,正积极训练、部署大模型,将AI技术应用于核心场景。电力、医疗、制造、交通和零售等行业处于数字化阶段,积极探索AI应用的落地。而餐饮、建筑和农牧业等仍处于起步阶段。二是人工智能技术正在加速与传统实体产业的融合,特别是在制造业、医疗、交通等领域。根据《中国互联网发展报告2024》,中国已建成近万家数字化车间和智能工厂,其中90%以上的示范工厂应用了人工智能和数字孪生技术。 3.行业应用正成为人工智能竞争的焦点 技术与产业竞争的焦点已经从单一的计算量和模型参数量转变为对高质量数据集规模的重视。基于规模理论(ScalingLaw) 的发现,在人工智能领域,模型性能的关键影响因素包括计算量、模型参数量和数据集规模。其中,计算量取决于算力水平,模型参数量决定模型大小,而数据集规模作为人工智能系统的原材料,其规模和质量直接影响模型训练的效果和应用的广泛性。国内外人工智能技术的应用正在不断落地,尤其是在数据密集型行业如金融、医疗健康等领域。这是因为高质量、多样化的数据对于训练有效的模型至关重要,能够显著提升人工智能应用落地效果。 目前国内也呈现出在行业赋能效果提升上发力的趋势。一是 从模型开发到更关注高价值场景的开发。模型开发和优化需要投入大量资源,随着基础大模型能力的显著跃升,企业的工作重点 正在从模型开发和调优转移到高价值场景的应用开发上。企业可 利用已有的基础模型、行业模型、小模型和机理模型,专注行业场景的应用需求。二是从关注单点技术指标到考虑整体成熟度。人工智能技术体系垂直整合度高,企业进行技术选择时,正从聚焦个别技术指标评估转向软硬协同整体系统的成熟度和适用性的评估。大规模集群能力、大参数模型训练能力以及算网存一体调优能力等,成为评价技术成熟度的关键。采用主流成熟技术可以保护企业投资,确保技术体系能长期满足需求。三是从追求短期技术优势到重视长期可持续。在当前国际产业竞争大环境条件下,确保产业链和供应链的可持续性至关重要,企业追求短期技术优势,长期看可能影响系统的持续演进和升级能力。 (二)人工智能行业应用建设发展模式 当前,人工智能行业应用的建设通常存在以下两种典型模式,这些模式基于业务建设目的的不同而区分。建设的行业应用以服务企业自身为目标的自研创新模式以及以服务行业内其他企业 为目标的平台赋能模式。 1.自研创新模式 自研创新模式重点关注内部业务应用需求,需要解决与现有业务系统融合和功能复杂定制的问题。其特点如下: 一是聚焦内部业务需求。以满足自身业务需求为主要目标,通过分析自身业务流程中的痛点和机会,利用人工智能技术进行针对性的优化和创新。二是与现有业务系统融合度高。人工智能业务应用需深度融入企业现有的业务系统,并服务于企业自身关键业务。三是功能定制复杂程度高。企业对系统功能定制复杂度要求高,以更好地满足其独特的业务需求和工作流程。 2.平台赋能模式 平台赋能模式则需要关注市场拓展、业务运营和商业是否成功,以保障业务可持续发展。一是关注市场拓展与商业可持续。将人工智能相关的资源或应用作为一种服务提供给外部客户,例如提供行业数据集和行业模型,为行业客户提供数据分析和预测服务等。二是关注技术创新与合作。通过与外部伙伴的合作,不断改进算法和模型,并形成有竞争力的生态系统。三是关注品牌建设与行业影响力。树立行业领导者形象,参与和主导在行业协 会组织的技术研讨和标准制定工作,推动人工智能技术在行业中的规范应用和发展。 3.两种模式的关系 平台赋能模式一般由企业自研创新模式进一步拓展而来。不同的业务发展模式并不相互割裂,很多企业从自研创新模式开始,通过进一步建立面向外部服务的运营实体,并叠加新的系统能力,实现内部成熟能力的自建他用,