版权声明 本白皮书由全国智能计算标准化工作组图计算研究组编著,由全国智能计算标准化工作组发布,旨在为图计算领域提供前沿动态和趋势洞察。本白皮书的著作权受法律保护,转载、摘编、翻译或利用其他方式使用本白皮书文字或观点的,应注明来源。 编制说明 感谢以下专家和学者对本白皮书编制工作的鼎力支持(注:排名不分先后)。 专家顾问 林学民欧洲科学院院士、IEEEFellow、上海交通大学讲席教授 金耀初欧洲科学院院士、IEEEFellow、西湖大学讲席教授 金海SAC/SWG32图计算研究组召集人、华中科技大学教授 陈文光SAC/SWG32图计算研究组联合召集人、蚂蚁集团技术研究院院长/副总裁 石川北京邮电大学特聘教授、GammaLab实验室创始人 陈华钧浙江大学教授、OpenKG牵头发起人 邹磊北京大学教授、图数据库gStore项目负责人 张岩峰东北大学教授、计算机学院副院长 叶小萌杭州欧若数网科技有限公司创始人 张晨浙江创邻科技有限公司创始人 梁磊蚂蚁集团知识图谱技术总监 编制组组长 洪春涛蚂蚁集团图计算负责人 陈红阳SAC/SWG32图计算研究组联合召集人、之江实验室数据枢纽与安全研究中心副主任 编制组成员 蚂蚁科技集团股份有限公司之江实验室 范志东、林恒、桂正科、郭智慧、孙梦姝、陈发强、刘永超、郑达、彭晋、崔安颀、赵培龙、李少衡、吕松霖、何雨潇、历鹏飞、陈梓康 余婷、余磊、杨林瑶、黄丹丹、蒙贵云 北京邮电大学浙江大学 杨成、黄海张文、张强、王鑫达 西湖大学东北大学 吴泰霖陈朝亿、付振波、曹春榆、巩树凤 杭州悦数科技有限公司浙江创邻科技有限公司 古思为、鲍翰林、方扬周研、童冰 北京大学北京交通大学 吴伟刘钰 复旦大学北京海致星图科技有限公司 郑卫国、张志杰沈游人、杨帆、王铮 深圳市腾讯计算机系统有限公司信雅达科技股份有限公司 姚亮、何峰、谢思发、程序林路、嵇津湘、李云波 北京枫清科技有限公司 吴敏 推荐语 图计算技术与人工智能,特别是大模型的融合,正在为信息处理和知识表示开辟新的前沿。图结构能够有效表达数据的深层关系,图与大模型的结合显著提升了大模型的逻辑推理能力,在解决大模型幻觉等问题上展现出强大潜力。本白皮书梳理了这一领域的最新进展,并对其未来的可能性进行了分析讨论,为读者提供了一个前瞻性的理解视角。 ——林学民,欧洲科学院院士、IEEEFellow、上海交通大学讲席教授 大模型时代,将图计算与AI深度融合有着广阔的前景和重要的影响。这一白皮书对图计算与AI融合的关键技术、解决方案和应用案例进行了详尽的梳理,尤其在与大模型的融合、可信图计算、科学研究和产业落地等前沿研究和应用方面,做了精彩的阐述。 ——金耀初,欧洲科学院院士、IEEEFellow、西湖大学讲席教授 在信息科技迅猛发展的背景下,图数据和图应用逐步渗透到各行各业,图技术与AI的结合正在开创全新的可能性。本白皮书系统回顾了图智能的发展历程,深入讨论了图的核心技术与应用场景,展现了图技术在大模型浪潮中的关键作用。本白皮书旨在帮助读者深入理解图技术的最新进展与未来趋势,期望为读者带来深刻的行业洞察,进一步推动图智能技术的广泛应用与落地。 ——金海,SAC/SWG32图计算研究组召集人、华中科技大学教授 在当前科技飞速发展的时代,图计算与人工智能的结合展现出巨大的潜力与前景。图计算以其天然适应复杂关系网络的优势,为AI模型提供了丰富的结构化信息,使得模型不仅能够理解数据的表层特征,更能洞察其内在关联。随着大模型技术的出现,图+AI的协同效应必将进一步放大,推动智能系统向更高层次发展。 ——陈文光,SAC/SWG32图计算研究组联合召集人、蚂蚁集团技术研究院院长/副总裁 大模型浪潮下的AI技术快速发展,对图计算也产生了深刻的影响。该白皮书从数据、算法、应用三个层面对Graph+AI的结合方式进行详尽的分析,并针对大模型带来的全新学习范式,提出了图计算面临的新问题与挑战。通过总结以往问题的多种解决方案,并在产业落地与科学研究方面提供大量应用案例,该白皮书将为相关研究者如何发展大模型浪潮下的图计算提供有效参考。 ——石川,北京邮电大学特聘教授、GammaLab实验室创始人 本白皮书以大模型技术为背景,全面介绍了图技术在数据、模型和应用等方面的发展趋势。内容涵盖图模型的方法论、详细的技术解决方案以及丰富的实际应用案例,为读者提供了全景式的图技术与人工智能融合的深度解析。 ——陈华钧,浙江大学计算机科学与技术学院教授、OpenKG牵头发起人 图计算作为刻画和挖掘万物复杂关联关系的核心技术,已经广泛应用于诸多应用场景。近来大模型的强大的学习和泛化能力为人工智能的发展带来革命性地影响,如何融合图计算和最新的AI技术,已经成为业内共识。本白皮书全面、详实地介绍了“Graph+AI”的研究进展和未来展望,值得大家研读与思考。 ——邹磊,北京大学王选计算机研究所教授、图数据库gStore项目负责人 本白皮书深入探讨了图数据与AI结合的关键技术及其在多领域的应用潜力。内容涵盖了图技术在数据挖掘、模型优化和决策增强等方面中的广泛应用场景,以及丰富的案例与详尽的解决方案,为研究者和从业人员提供了系统性指导,揭示了图技术在大模型时代的关键价值。 ——张岩峰,东北大学教授、计算机学院副院长 从事图技术领域多年,我们见证了图技术从学术研究到实际应用的飞速发展,本白皮书正是这一领域最新进展的全面展示和深入探讨。本白皮书紧密结合当前AI大模型的浪潮,详细阐述了图技术与数据、算力、模型等多个关键技术的结合,无疑是所有对图技术感兴趣的读者的一本宝贵指南。 ——叶小萌,杭州欧若数网科技有限公司创始人 人工智能浪潮势不可挡,图技术和AI的结合将带来新的机遇。本白皮书详细分享了图模型的建设方案和应用案例,是对AI大模型时代图技术发展路径的一次全面综述。期待本白皮书为每一位读者带来具有前瞻性和全局观的产业洞察分析,加速推动图智能的行业应用落地。 ——张晨,浙江创邻科技有限公司创始人 序言 在数字化时代的浪潮中,图计算与人工智能这两项前沿技术在各自的发展与演变中逐渐交织,形成了一幅生动的科技蓝图。 图计算作为处理复杂关系网络的一种高效工具和计算模式,其起源可以追溯到18世纪数学家 欧拉提出的“七桥问题”。在20世纪60年代计算机科学发展的早期阶段,图计算就被应用于网络流优化、最短路径寻找等经典问题,为后续的数据挖掘、知识表示等领域提供了基础。随着大数据和互联网的迅猛发展,图计算在社交网络分析、金融风险控制、推荐系统、生物信息学等多个领域展现出了强大的潜力和应用价值。 同时,人工智能的发展也在不断演变。从70年代的专家系统、80年代的机器学习,到近十年来深度学习的崛起,人工智能技术已经渗透至社会生活的方方面面。尤其是在自然语言处理、计算机视觉等领域,深度学习模型所取得的突破性进展,极大加速了人工智能技术的普及与商业化进程。尽管如此,传统的人工智能方法在处理非结构化或高度互联的数据时仍显不足。正是在这种背景下,图计算与人工智能的融合成为了必然趋势。 在图神经网络出现之前,研究者们已经探索了多种将图计算与人工智能相结合的方法,包括图嵌入技术、概率图模型、图核方法等。图神经网络的出现,标志着图计算与人工智能开始深度结合。图神经网络通过在图结构上进行信息传播和聚合,实现了对图数据的高效建模和特征提取。这种结合不仅提升了人工智能模型在处理图数据时的表现,也解锁了图计算技术在智能化应用中的巨大潜能。 近年来,大规模预训练模型的兴起再次引领了人工智能技术的革命。这些模型凭借其卓越的理解和生成能力,展示了向通用人工智能迈进的可能性与“曙光”。同样的,大模型的出现也为图计算与人工智能的结合带来了新的机遇和挑战,比如,大模型的训练通常需要数量庞大且多样化的数据,图计算在捕捉数据深层次关系方面的能力为这一问题提供了潜在解决方案。而如何构建图基础模型以获得类似大语言模型的涌现能力和强泛化能力则是新的挑战。 在大模型的浪潮之下,如何巧妙地整合图计算和人工智能的优势,进一步深化二者的融合,并开拓更广阔的应用前景,已经成为当前学术界和产业界共同关注的焦点。本白皮书旨在全面解析图计算与人工智能(尤其是大模型技术)的交互现状,探讨其背后的原理、面临的问题与挑战、关键技术以及成功实践。希望通过本白皮书的系统梳理和案例阐述,激发更多关于图与人工智能融合创新的思考与探索,为相关领域的研究和应用提供有益的参考和启示,共同迎接一个充满无限可能的图智能未来。 目录 第1章背景1 第2章问题与挑战3 第3章关键技术6 3.1图数据处理6 3.2图神经网络8 3.3图基础模型18 3.4知识图谱工程21 3.5图应用38 第4章解决方案75 4.1基于图数据库+AI的申请反欺诈解决方案75 4.2基于关联分析的企业决策智能化解决方案77 4.3基于图算法分析的安全风控解决方案78 4.4图异常检测智能化解决方案80 4.5Graph驱动的检索增强生成技术解决方案81 4.6面向专业领域的知识增强生成(KAG)解决方案84 4.7中英双语大模型知识抽取框架OneKE94 第5章应用案例99 5.1产业落地99 5.2科学研究115 第6章总结与展望135 参考文献137 第1章背景 自20世纪中叶人工智能(ArtificialIntelligence,AI)概念提出以来,该领域的发展几经跌宕起伏。随着大数据领域的技术持续突破以及硬件算力的不断提升,以神经网络理论为基础的深度学习技术也逐步从“寒冬”走向各行各业。尤其是随着大模型(LargeLanguageModel,LLM)技术的兴起,AI技术正带着人类社会迈入下一个纪元。 图(Graph)计算领域也拥有着悠久的历史,最早可以追溯到18世纪数学家欧拉提出的“七桥问题”。伴随着大数据时代数据规模的急剧扩张以及数据关联分析复杂度的提升,图计算技术也迎来了飞速发展,并广泛地应用到社交网络、推荐系统、金融风控、生物信息等领域。 图数据模型在描述复杂数据关联关系以及计算可解释性上有着天然优势,将图计算技术与AI 技术相结合,并从中发掘出新的技术方向和应用场景,是非常有价值的研究课题。 数据层面,传统的机器学习方法对欧几里得数据有着较好的处理,但在非欧几里得数据上性能不佳,在模态与模型的适配上存在问题。因而我们需要针对性的设计合理的数据形式及处理模型。基于图论的图计算建模方法处理非欧几何数据是合理且自然的,其以节点表示实体,将实体与其特征一一对应,以边表示关系,将实体间的关系显式表示出来。知识图谱(KnowledgeGraph)则进一步在图数据上层构建了语义网络,将复杂关系建模为有标签的有向图,以表示事物之间的复杂关系。 算法层面,随着深度神经网络的迅猛发展,以图神经网络(GraphNeuralNetwork,GNN)、图表示学习为代表的方法为机器学习领域带来了新的进展。众多学者尝试将深度神经网络进行合理的改造以适应图的特殊结构,借助其强大的模型性能挖掘更深层次的信息,减少参数量并提高泛化能力。受到大语言模型的启发,图基础模型通过预训练和适应性方法提升模型在各种任务中的表达能力和泛化能力。通过在广泛的图数据上进行预训练,图基础模型能够适应多种下游图任务并具备两种核心能力:涌现和同质泛化。涌现能力意味着当模型参数足够多时,会出现新的功能。同质泛化能力表明模型具有通用性,能够适应多种图任务和不同领域的应用。与语言基础模型相比,图基础模型在数据和任务上存在显著差异。图数据的通用性和多样性使得开发一个“通用图模型”具有挑战。 应用层面,以LLM为核心,结合图计算的技术方案和应用场景也在如火如荼的发展,包括但不限于知识图谱、自然语言转图查询(Text2GQL)、图系统优化、图检索增强生成 (GraphRAG),以及结合图技术的智能体(Agent)系统等。 知识图谱的概念最早源自语义网的研究,目的是让计算机理