. ICS35020CCSL70 中华人民共和国国家标准 GB/T42131—2022 人工智能知识图谱技术框架 Artificialinteligence—TechnicalframeworkofknowledgegraPh 2022-12-30发布2023-07-01实施 国家市场监督管理总局 国家标准化管理委员会发布 中国标准出版社授权北京万方数据股份有限公司在中国境内(不含港澳台地区)推广使用 目次 前言Ⅲ 1范围1 2规范性引用文件1 3术语和定义1 4缩略语3 5概述3 5.1知识图谱概念模型 5.2知识图谱技术框架 …………………………………………………………………………………3 …………………………………………………………………………………4 6知识图谱供应方6 6.3知识图谱供应方的输入 6.4知识图谱供应方的输出 ……………………………………………………………………………6 ……………………………………………………………………………6 6.5知识图谱供应方的主要活动6 6.4.1活动流程 6.4.2知识表示 6.4.3知识建模 ………………………………………………………………………………………6 ………………………………………………………………………………………7 ………………………………………………………………………………………9 6.4.4知识获取10 6.4.5知识融合13 6.4.6知识存储14 6.4.7知识计算16 6.4.8知识溯源17 6.4.9知识演化18 6.4.10质量保障 ……………………………………………………………………………………19 7知识图谱集成方19 7.1知识图谱集成方的输入19 7.2知识图谱集成方的输出19 7.3知识图谱应用系统主要构成20 7.4知识图谱集成方的主要活动20 7.4.1活动流程20 7.4.2需求分析21 7.4.3系统设计22 7.4.4知识图谱集成23 7.4.5知识图谱应用系统开发24 7.4.6系统维护25 中国标准出版社授权北京万方数据股份有限公司在中国境内(不含港澳台地区)推广使用Ⅰ 7.4.7质量保障26 8知识图谱用户26 8.1知识使用者26 8.1.1知识使用者的输入26 8.1.2知识使用者的输出27 8.1.3主要活动27 8.2知识维护者27 8.2.1知识维护者的输入27 8.2.2知识维护的输出27 8.2.3主要活动27 8.3知识提供者27 8.3.1知识提供者的输入27 8.3.2知识提供者的输出27 8.3.3主要活动27 9知识图谱生态合作伙伴28 9.1知识图谱生态合作伙伴的输入28 9.2知识图谱生态合作伙伴的输出28 9.3主要活动28 附录A(资料性)知识图谱生态合作伙伴子角色说明29 参考文献30 Ⅱ中国标准出版社授权北京万方数据股份有限公司在中国境内(不含港澳台地区)推广使用 前言 本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。 本文件由全国信息技术标准化技术委员会(SAC/TC28)提出并归口。 本文件起草单位:中国电子技术标准化研究院、江苏赛西科技发展有限公司、深圳赛西信息技术有限公司、清华大学、成都数联铭品科技有限公司、中电科大数据研究院有限公司、沈阳东软智能医疗科技研究院有限公司、北京华宇元典信息服务有限公司、北京国双科技有限公司、青岛百洋智能科技股份有限公司、网智天元科技集团股份有限公司、华为云计算有限公司、北京百分点科技集团股份有限公司、四川大学、上海依图网络科技有限公司、腾讯云计算(北京)有限责任公司、天津大学、中国医学科学院生物医学工程研究所、同方知网数字出版技术股份有限公司、北京车之家信息技术有限公司、北京京航计算通讯研究所、南华大学、绿盟科技集团股份有限公司、海信集团控股股份有限公司、浙商银行股份有限公司、北京海致星图科技有限公司、之江实验室、南京行者易智能交通科技有限公司、山东省人工智能研究院、东软集团股份有限公司、山东亿云信息技术有限公司、华为技术有限公司、山东省计算中心(国家超级计算济南中心)、电科云(北京)科技有限公司、南京视察者智能科技有限公司、中国电信股份有限公司研究院、北京智通云联科技有限公司、厦门邑通软件科技有限公司、上海智能制造功能平台有限公司、上海智能制造系统创新中心有限公司、南京柯基数据科技有限公司、南京航空航天大学、中国电子科技集团公司第二十八研究所、上海工程技术大学、中电莱斯信息系统有限公司、北京富通东方科技有限公司、云从科技集团股份有限公司、南瑞集团有限公司(国网电力科学研究院有限公司)、杭州海康威视数字技术股份有限公司、北京百度网讯科技有限公司、中科软科技股份有限公司、海乂知信息科技(南京)有限公司、上海交通大学、厦门盈趣科技股份有限公司、厦门渊亭信息科技有限公司、北京智谱华章科技有限公司、富士康工业互联网股份有限公司、广州广电运通金融电子股份有限公司、北京电解智科技有限公司、浙江柏视医疗科技有限公司、如你所视(北京)科技有限公司、云孚科技(北京)有限公司、暗链科技(深圳)有限公司、中国电力科学研究院有限公司、浙江创邻科技有限公司、京东方科技集团股份有限公司、中电科新型智慧城市研究院有限公司、北京文因互联科技有限公司、云南昆船设计研究院有限公司、海尔优家智能科技(北京)有限公司、达而观信息科技(上海)有限公司、深圳市矽赫科技有限公司、郑州南河星科技有限公司、青岛海容商用冷链股份有限公司、医渡云(北京)技术有限公司。 本文件主要起草人:李瑞琪、李佳、韩丽、郭楠、贾仕齐、韦莎、李涓子、王伟光、查琳、郭晓妮、詹青、杨帆、贾承斌、侯磊、程序、李琴、邹丽华、杨斌、陈琦、苏海波、周磊、王海涛、石智中、白洋、蒲江波、刘丁枭、袁军、刘永彬、杨雷、宋明艳、谭培波、高雪松、陈嘉俊、熊林海、钟礼斌、何舟、李军、尹青云、陈通、高永超、陆保国、谢泽宇、张超、刘煜、柳军、王飞、王虎斌、郑毅、黄子珍、陈徯、刘安安、王鑫、张淯易、舒明雷、单珂、周福辉、方志军、吴鹏亮、钟臻哲、宋勋超、王洋、陈建成、洪万福、张鹏、严红、孙佩霞、胡芳槐、吴文旷、艾青、石晓东、赵耕弘、高艳、王秋月、李瑞瑞、陈光、段飞虎、王博宇、颜子夜、孙林、曾俊瑀、李爽、陈佳林、吴刚、李军、欧阳纯萍、王芳杰、聂为之、赵春昊、傅洛伊、谈元鹏、曲珊、周研、肖向春、刘博、李卫东、李源、张娟、宋文韬、张学琴、苏婧仪、李钊、蔡巍、李东海、丁军、吴刚、王先庆、张文斌、徐佳吉、姜伟浩、姚博、蔺静茹、苏玉召、马力、刘海涛、符海芳、鲍捷、张明英、张浩男、李笑如、王启迪、金耀辉、姜伟浩、王文广、王艺杰、孙伟、张树刚、洪鹏达、万亚平、蒋炜、张楠、郎俊奇、焦飞、马洪奎、杨娟、胡芳槐、李论、曹扬、张晨、李林峰。 中国标准出版社授权北京万方数据股份有限公司在中国境内(不含港澳台地区)推广使用Ⅲ 中国标准出版社授权北京万方数据股份有限公司在中国境内(不含港澳台地区)推广使用 人工智能知识图谱技术框架 1范围 本文件给出了知识图谱的概念模型和技术框架,规定了知识图谱供应方、知识图谱集成方、知识图谱用户、知识图谱生态合作伙伴的输入、输出、主要活动和质量一般性能等要求。 本文件适用于知识图谱及其应用系统的构建、应用、实施与维护。 2规范性引用文件 本文件没有规范性引用文件。 3术语和定义 下列术语和定义适用于本文件。 3.1 3.2 3.3 3.4 3.5 3.6 3.7 知识knowledge 通过学习、实践或探索所获得的认识、判断或技能。[来源:GB/T23703.2—2010,2.1] 实体entity 独立存在的对象。 实体类型entitytyPe 一组具有相同属性的实体集合的抽象。 知识元素knowledgeelement 描述某一事物或概念的不必再分且独立的知识单位。 注:本文件中谈及的实体、实体类型(概念)、属性、关系、关系类型、事件、规则等统称为知识元素。 联系association 两个或多个对象间语义上的关联。 [来源:ISO13374-2:2007,B.2.2.4,有修改] 知识图谱knowledgegraPh 以结构化形式描述的知识元素及其联系的集合。 知识单元knowledgeunit 按照一定关系组织的一组知识元素的集合。 3.8 3.9 本体ontology 表示实体类型以及实体类型之间关系、实体类型属性类型及其之间关联的一种模型。 注:又称本体模型。 [来源:ISO/IEC21838-1:2021,3.14,有修改] 图式schema 本体模型的规范化表达。 [来源:GB/T5271.28—2001,28.02.07,有修改] 3.10 属性attribute 一类对象中所有成员公共的特征。 [来源:GB/T40216—2021,3.1.2] 3.11 关系relation 实体、实体类型、实体组合或实体类型组合间的联系。 注:关系可描述实体类型和实体类型、实体类型和实体、实体和实体之间的关联方式。 3.12 事件event 发生在某个特定时间点或时间段、某个特定地域范围内,由一个或者多个角色参与的一个或者多个动作组成的事情或者状态的改变。 注:可表示为具有时间属性的实体和关系的组合。 3.13 3.14 实例instance 某个实体类型或关系类型的具体范例。 知识图谱供应方knowledgegraPhsuPPlier 使用数据、知识等构建知识图谱以满足特定需求,并提供基于知识图谱的基础工具或服务的组织。 注:基础工具和服务指可基于其构建复杂的应用程序或系统的中间件。 3.15 3.16 知识图谱集成方knowledgegraPhintegrator 根据知识应用需求,将知识图谱、信息系统或服务进行整合,提供知识图谱应用系统及服务的组织。 知识图谱用户knowledgegraPhuser 使用知识图谱应用系统及配套服务支持以满足自身需要的组织或个人。 注:知识图谱用户可对外输出必要数据或知识。 3.17 知识图谱生态系统合作伙伴knowledgegraPhecosystemPartner 为知识图谱供应方、集成方和用户提供知识图谱构建和应用所必需的信息基础设施、数据、工具、方法、标准和机制等的组织。 3.18 知识表示knowledgerePresentation 利用机器能够识别和处理的符号和方法描述人类的知识的活动。 3.19 知识建模knowledgemodeling 构建知识图谱的本体及其形式化表达的活动。 注:知识建模活动可包括实体类型定义、关系定义及属性定义。 3.20 知识获取knowledgeacquisition 从不同来源和结构的输入数据中提取知识的活动。 注:知识获取的数据源通常按数据组织结构的维度可分为结构化数据、半结构化数据、非结构化数据(如纯文本、音频和视频数据等)。 3.21 3.22 知识融合knowledgefusion 整合和集成知识单元(集),并形成拥有全局统一知识标识的知识图谱的活动。 知识存储knowledgestorage 设计存储架构,并利用软硬件等基础设施对知识进行存储、查询、维护和管理的活动。 注:常见的知识存储方式分为:基于关系数据库的存储方式、基于图数据库的存储方式、基于资源描述框架(RDF)数据库的存储方式等。 3.23 知识计算knowledgecomPuting 基于已构建的知识图谱和算法,发现/获得隐含知识并对外提供知识服务能力的活动。 注:知识计算可分为统计分析、推理计算等。知识的统计分析是对知识图谱蕴含知识结构及其特征的统计与归纳;知识的推理计算是从已有的事实或关系推断出实现知识图谱隐性知识的发现与挖掘。 3.24 3.25 知识溯源know