热门搜索：

中国AI大模型工业应用指数

信息技术2023-10-15-中国工业互联网研究院G***

AI智能总结

中国AI大模型工业应用指数概述

政策背景与重要性

国家战略支持：中国高度重视人工智能发展，将其视为构建新一代信息技术、新能源等新兴产业的关键技术之一。
政策驱动：国家层面及相关部门陆续发布政策文件，旨在深化人工智能在工业领域的应用，推动产业升级。

中国AI大模型工业应用指数

意义：
- 政府决策支持：为国家宏观决策提供依据，判断人工智能发展动态。
- 技术指导：帮助企业明确智能化发展方向，指导技术创新与应用。
- 市场导向：引导市场需求，促进人工智能技术与工业的深度融合。
体系：分为准确性指数与稳定性指数，涵盖多个细分维度，如语句能力、逻辑判断等。

数据来源与评估

行业覆盖：聚焦电子设备制造、装备制造、钢铁、采矿、电力、石化化工、建材、纺织等行业。
指标设置：包括准确性与稳定性两个维度，采用客观与主观评价相结合的方式。

结果概览

准确性：整体国内与国际大模型接近，部分行业（如电力、钢铁、建材）表现优于国际水平。
稳定性：国内大模型在特定领域展现出色的稳定性能，但整体略低于国际大模型。

后续规划与趋势

持续优化：不断完善工业语料库，提高模型适应性与泛化能力。
行业测评：开展更多行业大模型的准确性与稳定性评测。
合作交流：加强与国际同行的合作，共同推动人工智能技术的发展与应用。

专家团队

包括来自高校、科研机构和企业的多位院士、教授和工程师，负责指数编制与评估。

报告发布与联系方式

定期更新指数报告，提供数据分析与行业洞察。
提供联系信息，鼓励各界参与讨论与合作。

结论

中国AI大模型工业应用指数作为衡量人工智能技术在工业领域应用成效的重要工具，不仅反映了当前技术水平与行业需求，也为未来人工智能与工业融合提供了方向性的指引。随着政策支持和技术进步，预计该指数将更加全面地反映中国乃至全球人工智能技术的发展动态与应用趋势。

中国AI大模型工业应用指数中国工业互联网研究院香港科技大学中国经济信息社 2023年10月 1 1.背景：人工智能发展政策体系不断完善 国家高度重视人工智能发展党的二十大报告 构建新一代信息技术、人工智能、生物技术、新能源、新材料、高端装备、绿色环保等一批新的增长引擎。中共中央政治局会议（2023年4月28日） 要重视通用人工智能发展，营造创新生态，重视防范风险。 2023年二十届中央财经委员会第一次会议 要把握人工智能等新科技革命浪潮，推进产业智能化、绿色化、融合化。 工信部持续出台政策文件深化人工智能在工业领域的应用《工业互联网创新发展行动计划（2021-2023年）》 鼓励工业企业综合运用人工智能等技术，发展智能化制造，提升各要素智能化水平，实现全流程...... 《“十四五”信息化和工业化深度融合发展规划》 深化人工智能和工业融合应用，通过全面感知、实时分析、科学决策和精准执行，提升生产效率...... 《“十四五”智能制造发展规划》 提出加快研发人工智能在工业领域的适用性技术，推动人工智能等新技术在制造环节的深度应用......2 2.中国AI大模型工业应用指数意义与体系 指数意义政府支持：服务于国家决策，帮助判断AI宏观发展趋势。打造通用人工智能与工业融合发展的“风向标”，帮助了解人工智能与工业融合应用的整体与局部发展态势。产品迭代：服务于技术革新，促进大模型应用迭代升级。上下文扩充稳定性自我认知、抗污染准确度上下文精简稳定性逻辑、推理准确度概括、分析准确度反映大模型工业应用的优势与不足，促进技术落地、产品升级。 指数体系[1] 稳定性准确性中国AI大模型工业应用指数主、客观知识准确度文法稳定性数据稳定性业界指导：服务于行业发展，为企业智能化发展指明方向。通过发布该指数，可研判大模型在工业领域各行业应用的成熟度，为行业企业智能化升级提供可行性建议。为政府、研究机构、工业企业和社会公众提供一个权威、科学的综合评估，反映大模型技术在工业中的应用程度、产生效益和问题挑战。指数体系包括准确性指数，稳定性指数等细分指数。 [1]指数体系会根据大模型应用发展不断迭代，当前版本关注大模型在工业领域中知识问答场景。 3 3.中国AI大模型工业应用指数数据来源 数据来源：八大行业 指标数据：准确性与稳定性报告 1.准确性测评报告[1] 电子设备制造业装备制造行业电子器件、电子元件及电子专用材料、其他电子元件制造等。采矿行业煤炭、石油、天然气、黑色金属、有色金属等。电力行业电力生产、电力供应、热力生产和供应等。纺织行业棉纺织、毛纺织、麻纺织、丝绢、化纤等纺织及印染精加工。根据OT经验，结合外部数据源，构建8大行业测试数据集。金属制品、通用设备制造、专用设备制造、汽车制造等。钢铁行业炼铁、炼钢、钢压延加工、铁合金冶炼等。石化化工行业石油开采及加工、化学原料及化学制品制造、塑料制品、橡胶制品等。建材行业建筑材料及制品、非金属矿及制品、无机非金属新材料等。 2.稳定性测评报告[2] 选取工业领域规上企业收入总值前八的行业汇集知识问答数据。指标数据由前期发布的准确性与稳定性实测值计算生成。 [1]《通用人工智能大模型工业领域知识问答性能评估》，https://china-aii.com/newsinfo/6080469.html4 [2]《人工智能大模型在工业领域知识问答稳定性测评》，https://china-aii.com/newsinfo/6382460.html 4.中国AI大模型工业应用指数-准确性准确性：在知识问答中能够正确回答问题的能力。 国内外综合对比 细分能力对比[1] 客观准确度国内 57分国际 58分数指行业应用情况值 70 污染分析能力国内国际自我认知能力主观准确度语句能力 50 30 电子设备装备制造制造钢铁采矿电力石化化工建材纺织逻辑能力概括能力 •整体上，国内大模型能力和国际大模型的能力接近； •行业上，国内大模型在电力、钢铁、建材等行业上优势明显，其他行业与国际水平相比有进一步提升空间； •细分能力上，国内大模型在自我认知能力和污染分析能力有一定差距，在其它能力维度表现接近。 [1]污染分析能力、自我认知能力在指数计算时未单独计算，在细分能力对比图中展示仅为说明国内外5 大模型在这两方面的差异。 4.中国AI大模型工业应用指数-准确性 行业能力对比国内大模型准确性第一梯队（排名不分先后） 66:70 电子设备制造业国内外对比* 工业领域客观准确度文心一言(百度) 在电子设备制造、钢铁、建材等行业位于第一梯队，有较强的语句能力、逻辑能力、概括能力。污染分析能力主观准确度钢铁行业62:60 装备制造业63:62 电力行业60:51 采矿行业52:56 石化化工行业56:61 污染分析能力自我认知能力建材行业55:51 逻辑能力客观准确度主观准确度语句能力概括能力自我认知能力逻辑能力在装备制造、采矿、电力行业位于第一梯队，有较高的主观准确度，有较强的语句能力和概括能力。 ChatGLM（智谱）客观准确度语句能力概括能力纺织行业50:53 *国内:国际 360智脑（360）国外领先大模型均值污染分析能力在装备制造、采矿、石化行业位于第一梯队，有较高的客观准确度，有较强的语句能力。自我认知能力逻辑能力主观准确度语句能力概括能力6 4.中国AI大模型工业应用指数-稳定性稳定性：在原问题回答正确的前提下，受到噪音干扰后仍然能输出正确答案的能力。 国内外综合对比细分能力对比国内 71分国际 74分不相关选项数指行业应用情况值 90 顺序变化国内国际逻辑判断语义理解上下文 70 50 30 电子设备制造装备制造钢铁采矿电力石化化工建材纺织数值安全国际国内 •整体上，国内大模型略低于国际大模型; •行业上，国内在电子设备制造、电力、石化行业距离国际水平有一定差距，其他行业较为接近； •细分能力上，国内模型在语义理解、上下文理解等语言任务上表现出色，但在逻辑判断、应对顺序变化、过滤无关信息等方面仍存在局限性，需要结合更多数据集和最新的提示工程技术进行改进。量纲 7 4.中国AI大模型工业应用指数-稳定性 行业能力对比工业领域国内外对比* 电子设备制造业 72:90 装备制造业 79:82 钢铁行业 78:81 采矿行业 75:81 电力行业 73:81 石化化工行业 74:83 建材行业 74:79 纺织行业 75:80 国内大模型稳定性第一梯队（排名不分先后）语义理解不相关选项上下文星火认知（讯飞）在电力、建筑、纺织行业位于第一梯队，有较高语义理解和顺序变化稳定性。语义理解顺序变化在装备制造、钢铁行业位于第一梯队，有较高的语义理解、量纲处理和数值稳定性。逻辑判断不相关选项上下文安全量纲通义千问（阿里）顺序变化逻辑判断数值安全数值量纲在电子设备制造、石化、建材行业位于第一梯队，有较高的安全稳定性和不相关选项稳定性。 360智脑（360）不相关选项上下文语义理解顺序变化逻辑判断 *国内:国际国外领先大模型均值安全数值 8 量纲 5.中国AI大模型工业应用指数后续规划动态更新指数报告周期性更新模型指数。不断完善工业语料库完善工业语料库，扩充不同行业、不同领域、不同场景语料，为大模型应用指数提供测算基础。开展行业模型测评面向行业大模型的工业应用准确性与稳定性开展评测工作，在重点工业领域遴选一批优秀的行业大模型。持续扩展测评行业在现有的八大行业基础上不断增加测评行业，挖掘新的模型应用场景。 9 唐立新，中国工程院院士，IEEEFellow，东北大学副校长，第十四届全国人大代表，工业智能与系统优化国家级前沿科学中心主任和首席科学家。王国栋，中国工程院院士，钢铁行业专家，博士生导师。刘云浩，ACMFellow，IEEEFellow，长江学者，ACM主席奖、CCF王选奖获得者，清华大学教授，创新学院院长。於志文，哈尔滨工程大学党委常委、副校长，教育部“长江学者”特聘教授，国家杰出青年科学基金获得者。张涛,IETFellow，清华大学教授，信息科学技术学院副院长，自动化系系主任。张大庆，欧洲科学院院士，IEEEFellow，北京大学讲席教授，CCF普适计算专委会主任。刘江川，加拿大工程院院士，IEEEFellow，加拿大西蒙菲莎大学计算机学院正教授和大学杰出教授。张燕咏，IEEEFellow，中国科学技术大学教授，计算机科学与技术学院副院长，ACM中国副主席，科技部下一代人工智能重大项目负责人。刘劼，IEEEFellow，ACM杰出科学家，哈尔滨工业大学讲席教授，人工智能研究院院长。 6.专家组成员 10 贾佳亚，IEEEFellow，香港中文大学终身教授，全球计算机视觉、人工智能领域权威专家，国家科技部“新一代人工智能”重大项目核心专家。杨铮，IEEEFellow，清华大学副教授、博士生导师，国家万人计划。黄河燕，北京理工大学计算机学院教授，国家科学技术进步奖一等奖获得者。聂再清，清华大学国强教授，AIR首席研究员，微软学术搜索发起人，曾任微软自然语言理解平台LUIS技术负责人。沈阳，清华大学教授，博士生导师，中宣部“文化名家”暨“四个一批”入选者、教育部新世纪人才计划入选者。刘云新，清华大学国强教授，智能产业研究院首席研究员，前微软亚洲研究院主任研究员，国家重点研发计划项目负责人。张晓明，北京雁栖湖应用数学研究院工业与应用首席研究员，美国麻省理工学院博士。任磊，北京航空航天大学教授，博士生导师，复杂产品智能制造系统技术全国重点实验室专委会副主任，国家杰青。王帅，香港科技大学计算机系助理教授，博士生导师，谷歌学者。 6.专家组成员 11 下一步，中国工业互联网研究院、港科大、中国经济信息社持续更新“中国AI大模型工业应用指数”，加速推动人工智能技术与实体经济融合创新。在大模型问答性能、应用安全、标准制定等方面展开研究，欢迎交流合作。转载请注明来源：中国工业互联网研究院。联系人：叶老师13661350566吴老师15210188099 12 地址：北京市朝阳区酒仙桥北路甲10号403号楼电话：010-87901276 网址：www.china-aii.com 附录1：中国AI大模型工业应用指数-准确性评价标准评分标准： 1.每个行业抽取138道题目进行测试，其中： •单选题(105)，题判断题(30题)，简答题(3题)； 2.对于客观题 •回答正确得分（1分），错误不得分（0分）； 3.对于主观题 •按照基础能力，语句能力，概括能力，逻辑能力四个维度进行评价，每个维度5分； •对于每个维度，分五个等级，分别对应1-5分。准确性测试流程：输入问题根据回答进行赋分分维度进行能力统计准确性评测的能力维度，围绕AI大模型在客观准确性、主管准确性等子维度展开深入评估。准确性评测能力维度体系：主观准确性准确性客观准确性客观知识问答能力准确性指数定义: 逻辑能力概括能力语句、概括、逻辑能力语句能力抗污染分析能力自我认知、污染分析能力自我认知能力主观题目模型维度准确性指数 = 模型维度全部题目得分 ——————————— 全部题目总分能力维度第一梯队模型总分 ——————————— 第一梯队模型数量

点击免费查看完整报告